Свежие номера журналов

Татаринова А. Г. 4(2017)

УДК 004.934

А. Г. Татаринова, Д. Е. Прозоров

 

АЛГОРИТМ СОПОСТАВЛЕНИЯ БУКВ И ФОНЕМ НА ОСНОВЕ ПРАВИЛ 

В ЗАДАЧЕ ПОИСКА РЕЧЕВЫХ ДОКУМЕНТОВ ПО ТЕКСТОВОМУ ЗАПРОСУ

 

       Поиск речевой информации по текстовому запросу является актуальной, но трудной задачей. Один из подходов к решению этой задачи основан на преобразовании речи в текст. Преимущество данного подхода заключается в возможности использования лингвистической информации. К его недостаткам можно отнести ошибки, возникающие при работе систем автоматического распознавания речи и искажающие текст, по которому впоследствии выполняется поиск. Одним из способов уменьшения влияния ошибок распознавания на эффективность поиска речевой информации является сочетание алгоритмов фонемного транскрибирования и алгоритмов приближённого сравнения строк. В некоторых алгоритмах фонемного транскрибирования и, в том числе, при определении меры сходства фонем требуются оценки условных распределений фонем, сопоставляемым буквам транскрибируемого слова. Задача сопоставления известна как графемно-фонемное выравнивание. В статье представлен алгоритм графемно-фонемного выравнивания на основе правил. Алгоритм может быть использован для оценки условных распределений фонем при наличии обучающего словаря с соответствующими транскрипциями.

 

      Ключевые слова: графемно-фонемное выравнивание, фонемное транскрибирование, поиск речевых документов.