Здесь размещены, размещаются или будут размещены самые "неуловимые" карты в мире. Может, Вы хотите знать, сколько территории захвачено тамильскими повстанцами в Шри Ланке? Или на какую территорию претендуют хазарейцы в Афганистане? Какой флаг у басков и на каких размеров территории он развевается?
День 1. Девушка снимает себе парня и ведет к себе в комнату в общаге. Вопрос парня «Есть чё пожрать?» Девушка в истерике выставляет парня за дверь.
День 2. Девушка снимает себе парня и ведет к себе в комнату в общаге. Вопрос парня «Есть чё пожрать?» Девушка в истерике выбегает на балкон и кричит : «Да есть здесь нормальные мужики?». Ответ с верхних этажей (грубый мужской голос): «А чё, есть что пожрать?»
Explanation: While Comet McNaught ruled southern skies, last week's conjunction of the Moon and Venus could be enjoyed by denizens of both hemispheres of planet Earth. The two more commonly viewed celestial beacons produced this lovely twilight scene, recorded last Saturday in skies above Almodovar near Cordoba in southern Spain. Brilliant Venus and a slender crescent Moon seem to overlook the small town, along with a well-lit Castle Almodovar. The impressive castle's construction began in the 700s on the strategic site of a Roman fort. It was extensively restored in the 20th century.
Link Grammar Parser – это синтаксический парсер английского языка. Работает со словарем, включающем около 60000 словарных форм. Реализован на C для Unix. Есть также версия для Windows API32. Имеет консольный интерфейс.
Исходные предложения для разбора могут вводиться вручную с клавиатуры или задаваться в ASCII-файле для пакетной обработки. Программа распространяется бесплатно.
On-line версия программы математического анализа структуры текста. Целью анализа является определение близости любого из предлагаемых пользователем текстов к одному из авторских эталонов, определенных заранее. (Авторский эталон - это набор текстов данного автора, взятый из ресурсов Русской Фантастики). Программа анализирует входной текст и выдает имена трех писателей, которые могли бы быть его наиболее вероятными авторами. Кроме этого, программа находит три произведения каждого из авторов, которые наиболее близки данному тексту.
Компоненты грамматического разбора, морфологического анализа и лемматизации (нормализации) для английского, немецкого, финского, датского, норвежского, шведского, эстонского и русского языков. Это коммерческие продукты, которые могут быть использованы при разработке других систем.
Две версии (MonoConc Pro 2.0 и MonoConc 1.5) программы построения конкорданса для заданного корпуса символьных (ASCII) текстов. Утверждается, что размер текстов может достигать нескольких миллионов слов. Реализованы возможности различных режимов поиска: с помощью символов маскирования, регулярных выражений, контекстно-чувствительного поиска. При обработке текстов c внутренней разметкой (HTML/SGML) теги включаются в состав конкорданса (это нехорошо). Различные варианты сортировки. Функции частоты встречаемости слов и словосочетаний. Различные режимы вывода конкорданса. Есть возможность генерации индексов и словников.
Обе программы реализованы для Windows 95 и выше. MonoConc 1.5 имеет вариант реализации для Windows 3.1 (16-разрядная версия).
Версия MonoConc 1.5 является несколько облегченной в сравнении с MonoConc Pro. К сожалению обе эти программы не бесплатны. Лицензия на использование MonoConc Pro в образовательных целях стоит $85.00; MonoConc 1.5 - $65.00. Имеется возможность загрузки бесплатных демо-версий, которые имеют ряд ограничений в сравнении с реальными версиями.
Демо-версия очень интересного инструмента анализа символьных текстов. Позволяет построить семантическую сеть понятий, выделенных в обрабатываемом тексте, со ссылками на контекст. Имеется возможность смыслового поиска фрагментов текста с учетом скрытых в тексте смысловых связей со словами запроса. Позволяет анализировать текст путем построения иерархического дерева тем/подтем, затрагиваемых в тексте. Также имеется возможность реферирования текста.
Кроме отдельного продукта TextAnalyst также предлагается инструментарий разработчика TextAnalyst SDK, включающий функции лемматизации (приведения слов к нормальной форме) для русского и английского языков, построения частотных списков понятий, поиска слов в контексте и т.д.
Еще одна комонента, TextAnalyst Lib, может использоваться для пострения гипертекстовых электронных книг.
Все компоненты реализованы для Windows 95 и выше и доступны для бесплатной загрузки. Интересно отметить, что на американском рынке технологию TextAnalyst продвигает фирма Megaputer Intelligence Inc.
Лингвистические компоненты, словари и библиотеки классов
Авторская страничка ведущего разработчика компании Рэмблер А.Коваленко, на которой представлены его лингвистические разработки, реализованные в ряде существующих информационно-поисковых систем - Апорт!, Рэмблер, Мета, системе Пропись 4.0 и других. Можно скачать описания и демо-версии компонентов.
Замечательная компонента, подключаемая к Microsoft Internet Explorer (версии 5.0 и выше), которая позволяет в мгновение ока получить упорядоченный индекс слов в загруженном HTML документе. Индекс может быть упорядочен по алфавиту или частоте. Для каждого слова в индексе можно исследовать контекст, в котором это слово встречается. Выбранные слова по желанию заносятся в персональную базу знаний, которая позволяет систематизировать найденные документы удобным образом. Можно скачать бесплатную версию.
Проект "Худломер" связан с задачей автоматической классификации стиля русскоязычных текстов. Автором были собраны и проанализированы 4 корпуса текстов, взятых из русской сети. Сюда вошли художественные произведения, публицистика, научные статьи и протоколы диалогов через ICQ и IRC. В результате были получены эмпирические кривые распределения длин слов в текстах, в зависимости от стиля. Эти кривые используются в качестве эталонов при классификации.
Unique Record Set Management utility, Win9x/NT/2000. Утилита для построения и обработки словарных частотных индексов. Позволяет обрабатывать входные документы в форматах обычного текста, HTML и MS Word. Возможности анализа и обработки пар словарных индексов как двух множеств. Экспорт результатов в выходной файл.
Сайт, на котором представлены разработки бывших сотрудников компании Диалинг, прекратившей свое существование в мае 2001г. Среди предлагаемых продуктов:
- модуль графематического анализа текста;
- компоненты морфологического анализа для русск. и англ.яз.;
- модуль автоматического уничтожения омонимии;
- модуль семантического анализа текста;
- различные тезаурусы.
Также опубликована диссертация А.Сокирко "Семантические словари в автоматической обработке текста" по теме машинного перевода.
Сайт, на котором представлены разработки известной компании Гарант-Парк-Интернет. Cреди представленных технологий:
- анализ и классификация текстов, автоматическое реферирование;
- различные варианты поиска текста;
- морфологичекий, синтаксический и семантический анализ текста;
- средства навигации по большим массивам текстов;
- различные научные публикации авторов проекта.
Коммерческая программа, представляющая собой консультанта, помогающего Пользователю при написании различных текстов. Пользователь выбирает ряд параметров, характеризующих желаемый результат, а программа выдает ему рекомендации по написанию текста и иллюстрирует их примерами. В основе программы - анализ 12500 текстов мастеров русского языка, начиная от писателей-классиков и заканчивая современными журналистами и политиками. К сожалению в программе отсутствуют возможности анализа написанного Пользователем текста.
Для загрузки доступна демо-версия, являющаяся облегченным вариантом профессиональной версии. Демо-версия также включает руководство пользователя и демонстрационный обучающий ролик. Программа требует для работы русские Windows 9x/2000/NT и Microsoft Word.
Программа, предназначенная для анализа и обработки текстов в среде Windows 95/98/NT. Это удобный и мощный инструмент, позволяющий строить индексы словоформ и синтагм для заданного множества текстов. Программа понимает тексты в основных русскоязычных кодировках и может обрабатывать документы в формате HTML, игнорируя их разметку. Последняя версия программы снабжена модулем порождения словоформ русского языка.
Webclopedia Targeted Delivery of Multilingual Information
проект, связанный с созданием информационных агентов, способных генерировать ответы пользователю на основе анализа разнородных коллекций ресурсов, доступных в сети.
Ресурс включает доступные для загрузки в виде zip-архивов следующие словари исходных словоформ русского языка
- Обратный и обычный словари, образованные из словаря А. А. Зализняка (93392 слова).
- Обратный и обычный словари Про-Линг (125723 слова).
- Обратный, обычный и частотный словари, полученные в результате анализа произведений русской литературы XIX-XX веков (162232 слова).
Здесь, похоже, собрана вообще вся информация о говорящих программах, существующих сегодня в сети. Начиная c классики (например, всемирно известной Элизы доктора Фейгенбаума) и кончая самыми последними разработками с использованием языка искусственно-интеллектуальной разметки (AIML).
Экспериментальная программа для генерации русскоязычных стихоподобных текстов ("инструмент поэта"). Программа способна конструировать русские неологизмы на основе заданного словаря с лексико-статистической информацией. Несмотря на свою "древность", программа интересная и может позабавить своими словесными изобретениями. Прилагается утилита для создания авторских рабочих словарей. Распространяется бесплатно. Есть исходные тексты на языке C. Работает как консольное приложение MS-DOS.
Эмпирически установлено, что активность Солнца, определяемая, в частности, по количеству пятен на Солнце, меняется с 11-летним циклом. Вместе с тем, 11-летний цикл – не единственный, на него накладываются более долгопериодические процессы.