Татаринова А. Г. 4(2017)
УДК 004.934
А. Г. Татаринова, Д. Е. Прозоров
АЛГОРИТМ СОПОСТАВЛЕНИЯ БУКВ И ФОНЕМ НА ОСНОВЕ ПРАВИЛ
В ЗАДАЧЕ ПОИСКА РЕЧЕВЫХ ДОКУМЕНТОВ ПО ТЕКСТОВОМУ ЗАПРОСУ
Поиск речевой информации по текстовому запросу является актуальной, но трудной задачей. Один из подходов к решению этой задачи основан на преобразовании речи в текст. Преимущество данного подхода заключается в возможности использования лингвистической информации. К его недостаткам можно отнести ошибки, возникающие при работе систем автоматического распознавания речи и искажающие текст, по которому впоследствии выполняется поиск. Одним из способов уменьшения влияния ошибок распознавания на эффективность поиска речевой информации является сочетание алгоритмов фонемного транскрибирования и алгоритмов приближённого сравнения строк. В некоторых алгоритмах фонемного транскрибирования и, в том числе, при определении меры сходства фонем требуются оценки условных распределений фонем, сопоставляемым буквам транскрибируемого слова. Задача сопоставления известна как графемно-фонемное выравнивание. В статье представлен алгоритм графемно-фонемного выравнивания на основе правил. Алгоритм может быть использован для оценки условных распределений фонем при наличии обучающего словаря с соответствующими транскрипциями.
Ключевые слова: графемно-фонемное выравнивание, фонемное транскрибирование, поиск речевых документов.