Компьютер научат распознавать шутки, иронию и метафоры

УченыеТюмГУразрабатывают технические алгоритмы, способные определять, есть ли в высказывании юмор, ирония и метафора. Результаты исследования представлены на традиционнойконференции «Множественность интерпретаций – 7: цифровая перезагрузка», состоявшейся в ТюмГУ. Человек, который успешно владеет родным языком, обычно легко может определить, связано ли то или иное выражение с реальностью или используется в переносном смысле. При этом человек, скорее всего, обладает универсальным когнитивным механизмом выявления иносказательности, значит, подобный механизм можно воспроизвести и в машине. Именно такую задачу поставила перед собой разработчик программы«PunFields» доцент Института социально-гуманитарных наук ТюмГУ Елена Михалькова. «Распознавание юмора и других видов иносказательности нужно для решения прикладных задач. Во-первых, для машинного перевода, который пока почти совсем не может интерпретировать художественную речь, а также для диалоговых систем, типа Алисы или Сири, которые опять же не воспринимают иносказательность; во-вторых, данные исследования раскрывают саму природу изучаемых явлений – то есть что такое юмор в принципе и как он функционирует», – отмечает Елена Михалькова. Программа «PunFields»предназначена для английского языка и распознает каламбуры с такой же результативностью, как иностранные студенты-лингвисты 1-2 курсов. Результаты работы программы подтверждены экспериментом, и в настоящее время специалисты ставят перед собой задачу сделать так, чтобы программа одинаково успешно распознавала юмор и иронию, используя при этом один и тот же алгоритм. «Программа основана на машинном обучении, которое на большом количестве примеров юмора, иронии, метафоры учится распознавать смысловую “инконгруэнтность” высказывания: несовпадение в высказывании двух смысловых планов – прямого, того, что воспринимается в первую очередь, и переносного. Переносный смысл можно считать скрытым. Когда его наличие в высказывании становится ясным, мы понимаем, что перед нами не изложение фактов, а иносказание, такоекакюмор, метафора или ирония», –рассказала Елена Михалькова изданию «ИКС-медиа». Изучать тональность высказываний в социальных медиа, обрабатывать контексты огромных объемов постов – лишь одна из прикладных задач, решение которой требуется от современных цифровых лингвистов. В ТюмГУ эти задачи внимательно изучают социологи, лингвисты, IT-специалисты. «Наша задача – исследовать алгоритмы толкования текста, попытаться найти объективную истину в толкованиях», –уточняет Е.Михалькова. –При этом не стоит забывать, что гуманитарное знание можно верифицировать с помощью компьютерных методов. Сейчас существуют действенные алгоритмы компьютерной обработки текстов для разных целей». В этом годуконференция состоялась в ТюмГУ в седьмой раз и привлекла внимание российских и зарубежных ученых, среди которых филологи, историки, лингвисты, антропологи, социологи, математики, педагоги, специалисты в области IT-технологий. Особое внимание было уделено корпусной лингвистике, культуромике, разработке тезаурусов и информационной этике. Директор СоцГума ТюмГУпрофессор Игорь Чубаров отмечает: «Новые направления научных исследований в области гуманитаристики достойны отдельного разговора. Отмечу их общую особенность – они строятся по принципам Digital Humanities, связанные, например, с применением методов big data к гуманитарным исследованиям. Иными словами, мы объединяемся и двигаемся за пределы своих дисциплинарных границ на основе внедрения цифровых технологий в гуманитаристику, в данном случае в лингвистику». Источник: Управление стратегических коммуникаций ТюмГУ
Партнёр: Тюменский государственный университет