14:49 / 15.01.2013 Наука и техника

Неприличные выражения суперкомпьютера IBM Watson заставили чистить ему память

А все потому, что ранее разработчики из добрых побуждений закачали в его память словарь уличного жаргона

Вот уж действительно казусный случай произошел с разработчиками суперкомпьютера IBM Watson, которые хотели сделать как лучше, а получилось наоборот! О том, что они допустили большую ошибку, закачав в память своего «подопечного» словарь уличного жаргона, они поняли в тот момент, когда IBM Watson прилюдно вогнал их в краску стыда, сообщили зарубежные СМИ.

Дело в том, что IBM Watson обучен распознавать смысл предложений/вопросов и отвечать на них, используя усвоенные массивы неструктурированных данных (data mining). Благодаря этому в 2011 году компьютер выиграл у чемпионов телевикторины «Своя игра» (Jeopardy), после чего начал изучать медицинские справочники с целью диагностировать болезни по симптоматике.

Окрыленные успехом, разработчики и подумали, что информация о дополнительных смыслах слов улучшит искусственный интеллект и поможет ему лучше понимать людей. Однако они крупно ошиблись. Уличный жаргон, закачанный с сайта Urban Dictionary, оказался исключительно вреден суперкомпьютеру, и однажды он даже ответил на вопрос неприличным словом «Bullshit».

В результате разработчики приняли решение очистить память IBM Watson от сленга и поставить фильтр на выдаваемые слова, чтобы впредь даже случайно не допустить ненормативной лексики в прямом эфире.

Ответственность на себя взял один из сотрудников проекта Эрик Браун (Eric Brown), который на фотографии он изображён внутри кластера IBM Watson.

В интервью CNNMoney Эрик Браун рассказал, что проблема возникла с тем, что компьютер не мог определить, какой смысл слова является приличным, а какой — нет. Из-за этого он иногда использовал слова в неприличном смысле.

Эрик Браун говорит, что некоторые плохие привычки у IBM Watson появились также после чтения Википедии. Вот почему удаления Urban Dictionary оказалось недостаточно, а пришлось ставить дополнительный словарный фильтр. В будущей работе IBM Watson как врача-диагноста лексика вроде OMG или LOL вовсе неуместна.

Ранее «Багнет» сообщал о том, что компания IBM начала разработку нового суперкомпьютера.

Денис Штукарь