Чому ІІ досі не опанував перекладом мов досконало?

У міфі про Вавилонську вежу люди задумали побудувати вежу-місто, яка дістала б до небес. І тоді Творець зрозумів, що ніщо більше не буде стримувати людей і возомнят вони про себе казна-що. Тоді Бог створив різні мови, щоб перешкодити людям і щоб вони більше не могли з легкістю працювати спільно. У наш час, завдяки технологіям, ми відчуваємо безпрецедентну зв’язаність. Проте ми все ще живемо в тіні Вавилонської вежі. Мова залишається бар’єром в бізнесі та маркетингу. Незважаючи на те, що технологічні пристосування можуть легко і швидко з’єднуватися, люди з різних частин світу найчастіше не можуть.

Бюро перекладів намагаються встигати: роблять презентації, контракти, інструкції з аутсорсингу і рекламні оголошення для всіх бажаючих. Деякі агентства пропонують так звану «локалізацію». Наприклад, якщо компанія виходить на ринок у Квебеку, їй потрібна реклама на квебекськом французькою, а не на європейському французькою мовою. Компанії можуть серйозно постраждати із-за неправильного перекладу.

Глобальні ринки чекають, але мовний переклад силами штучного інтелекту ще не готовий, незважаючи на недавні досягнення в області обробки природної мови та аналізу настроїв. У ІІ і раніше виникають труднощі з обробкою запитів навіть на одній мові, не кажучи вже про переклад. У листопаді 2016 року Google додала нейронну мережу в свій перекладач. Але деякі її переклади раніше соціально і граматично дивні. Чому?

«До честі Google, компанія ввела досить багато покращень, які з’явилися майже за одну ніч. Але я не особливо їх використовую. Мова — це важко», говорить Майкл Хаусман, головний науковий співробітник з науковим дослідженням у RapportBoost.AI і викладач Singularity University.

Він пояснює, що ідеальний сценарій для машинного навчання і штучного інтелекту буде полягати в фіксованих правил та чітких критеріях успіху або невдачі. Шахи — це очевидний приклад, а разом з ними і го. Комп’ютер дуже швидко опанував цими іграми, тому що правила їх ясні і чіткі, а набір ходів обмежений.

«Мова ж — майже прямо протилежний. Не існує чітких і вивірених правил. Розмова може йти в нескінченному числі різних напрямків. І вам, звичайно, потрібні також позначені дані. Вам потрібно говорити машині, що вона робить правильно, а що ні».

Хаусман зазначив, що позначити в мові інформаційні ярлики принципово складно. «Два перекладача не можуть домовитися про правильність перекладу», говорить він. «Мова — це Дикий Захід з точки зору даних».

Технології Google зараз здатні розуміти речення цілком, не намагаючись переводити окремі слова. Але глюки все одно трапляються. Йорг Майфуд, доцент кафедри іспанської мови, спеціаліст з латинської літератури в Університеті Джексонвилль пояснює, чому точні переклади поки не даються штучного інтелекту:

«Проблема в тому, що розуміти пропозицію цілком поки недостатньо. Так само, як значення окремого слова залежить від іншої частини пропозиції (здебільшого в англійській мові), значення пропозиції залежить від іншої частини параграфа і тексту в цілому, а значення тексту залежить від культури, намірів мовця і іншого. Сарказм і іронія, наприклад, мають сенс лише в широкому контексті. Ідіоми також можуть бути проблемними для автоматизованого перекладу».

«Переклад Google — відмінний інструмент, якщо ви використовуєте його як інструмент, тобто не намагаючись замінити людське навчання або розуміння», говорить він. «Кілька місяців тому я пішов купувати дриль у Home Depot і прочитав напис під машиною: «Saw machine». (Машинна пила). Нижче був іспанський переклад ‘La máquina vió,’ що означає «Машина це бачила». «Saw» перевели не як іменник, а як дієслово минулого часу».

Доктор Майфуд застерігає: «Ми повинні знати про крихкість такої інтерпретації. Тому що перекладати — це по суті інтерпретувати, не просто ідею, але і почуття. Людські почуття та ідеї, які можуть зрозуміти тільки люди, а іноді навіть ми, люди, не можемо зрозуміти інших людей».

Він зазначив, що культура, стать і навіть вік можуть створювати перешкоди для цього розуміння, а надмірна залежність від технологій веде до нашого культурного і політичного занепаду. Доктор Майфуд згадав, що аргентинський письменник Хуліо Кортасар називав словники «кладовищами». Автоматичні перекладачі можна було б назвати «зомбі».

Ерік Камбриа, академік, досліджує ШІ, і професор Технологічного університету Наньянга в Сінгапурі, займається здебільшого обробкою природної мови, яка лежить в основі перекладачів на основі ІІ. Як і доктор Майфуд, він бачить складність і пов’язані ризики в цьому напрямку. «Існує дуже багато речей, які ми робимо несвідомо, коли читаємо текст». Читання вимагає виконання багатьох непов’язаних завдань, які не під силу автоматичним перекладачам.

«Найбільша проблема машинного перекладу на сьогодні полягає в тому, що ми схильні переходити від синтаксичної форми пропозиції на мові введення до синтаксичною формою цієї пропозиції на цільовому мовою. Ми, люди, так не робимо. Ми спершу розшифровуємо значення пропозиції на вхідній мові, а потім кодуємо це значення на цільовому мовою».

Крім того, існують культурні ризики, пов’язані з цими перекладами. Доктор Рамеш Шринивасан, директор Лабораторії цифрових культур в Каліфорнійському університеті в Лос-Анджелесі, каже, що нові технологічні інструменти іноді відображають лежать в основі упередження.

«Повинно бути два параметри, які визначають, як ми проектуємо «інтелектуальні системи». Один — це цінності і, можна так сказати, упередження того, хто створює системи. Друге — це світ, в якому система буде вчитися. Якщо ви створюєте системи ШІ, які відображають упередження свого творця і широкого світу, іноді бувають досить значні провали».

Доктор Шриванисан каже, що інструменти перекладу повинні бути прозорими щодо можливостей і обмежень. «Бачите, ідея того, що одна система може взяти мови (які дуже різноманітні семантично і синтаксично) і об’єднати їх або в якійсь мірі узагальнити, або взагалі зробити одним цілим, це безглуздо».

Мері Кокран, кофаундер Launching Labs Marketing, бачить комерційний потенціал зростання. Вона зазначила, що списки на онлайн-ринках на кшталт Amazon можна в теорії автоматично переводити і оптимізувати для покупців в інших країнах.

«Я вважаю, що ми зараз торкнулися лише верхівки айсберга, так би мовити, щодо того, що ИИ може зробити з маркетингом. І з поліпшеним перекладом і глобалізацією по всьому світу ШІ не може не привести до вибухового зростання ринку».