Автор: mirage
Дата: 05-09-06 13:42
Сергей, позволю себе в след за Бородой заметить Вам, что надо быть по меньшей мере Гераклом (или очень хорошим хакером:), чтобы быстро "порешать" Вашу задачку. Поскольку она несколько сложнее, чем, похоже, Вам представляется. Есть, например, такой Russian Context Optimizer for BackOffice (RCO) - программное обеспечение, которое добавляет в поисковую службу Microsoft Indexing Service компоненты, отвечающие за учет морфологии русского языка при построении индексов и обработке поисковых запросов. Работает на основе словаря лингвистических данных для русского языка. Словарь включает в себя около 110 тысяч словооснов, 6 тысяч окончаний, 1,5 тысячи моделей словоизменения, 200 суффиксов, что соответствует 2,5 миллионам распознаваемых словоформ (в русском языке существует четыре типа парадигм (совокупности словоформ) словообразования: парадигма существительного - 14 грамматических форм, парадигма прилагательного - 31 грамматическая форма и парадигма глагола - 146 форм, не считая 86 возвратных. К четвертому типу (вырожденному) относятся все неизменяемые слова). Примите к сведению.
|
|