Watson (IBM) — изкуствен интелект, победил шампиони в Jeopardy!

Watson (IBM) — как изкуствен интелект победи шампионите в Jeopardy!: история, технология, НЛП и влиянието върху машинното обучение и бизнеса.

Автор: Leandro Alegsa

Watson е изкуствено интелигентна компютърна система, разработена от IBM с цел да разбира и отговаря на въпроси, зададени на естествен език. Проектът е част от изследванията на IBM в областта на обработката на езика и машинното обучение (известен като DeepQA; ръководител на екипа по време на състезанието беше David Ferrucci). Основната цел беше да се покаже способността на системата да разбира сложни въпроси, да търси доказателства в големи корпуси текст и да дава точни отговори с оценка за увереност. Watson е създаден, за да се състезава в американското телевизионно шоу Jeopardy! и през февруари 2011 г. участва в епизод срещу предишните шампиони Кен Дженингс и Брад Рътър. Watson спечели наградата за първо място от 1 млн. долара, а името му е отдаване на почит към Томас Джей Уотсън, който е бил председател и главен изпълнителен директор на IBM от 1914 до 1956 г.

Как работи Watson

По време на играта Watson имаше достъп до примерно 200 милиона страници текстови данни, включително пълния текст на Wikipedia, както и енциклопедии, речници, тезауруси, новинарски статии и книги. Важно е да се отбележи, че Watson не беше свързан с интернет по време на състезанието — той използваше само предварително заредените в системата данни и индексите върху тях.

  • Първа стъпка: при постъпване на подсказка системата генерира множество кандидат-отговори чрез търсене и комбиниране на релевантни фрагменти от своя корпус.
  • Втора стъпка: за всеки кандидат се изчисляват десетки до стотици характеристики (features) — например съвпадение на термини, близост на концепции, подкрепящи доказателства от различни източници и т.н.
  • Трета стъпка: тези характеристики се подреждат и агрегирани чрез алгоритми за машинно обучение, които оценяват вероятността кандидатът да е правилният отговор и връщат оценка за увереност.
  • Крайно поведение: на телевизионния екран се показваха трите най-вероятни отговора заедно с процента доверие. Ако увереността на системата за най-добрия отговор превишаваше предварително зададен праг, Watson "натискаше звънеца" и даваше отговора.

Тази архитектура комбинира техники от статистическо обработване на език, информационно извличане, класификация и машинно обучение, като фокусът е върху доказателственото оценяване на отговорите — т.е. не само да се предложи възможен отговор, но и да се предоставят подкрепящи доказателства и оценка за надеждността му.

Хардуер, ограничения и последици

За да може тематичното търсене, изчисляването на характеристики и ранкингът да се извършват в кратко време, Watson работи върху голям изчислителен клъстер от сървъри с висока паралелност и памет. Въпреки това, системата не "разбира" света по човешки начин — тя разчита на модели, статистика и наличните текстови източници. Това води и до видими ограничения: при двусмислени въпроси или такива, изискващи общо знание извън наличните бази, могат да възникнат грешки или висока увереност в неправилен отговор.

След успеха в Jeopardy! IBM започна да адаптира технологията зад Watson за практически приложения в различни области — медицина (подкрепа при диагностика и онкологична терапия), бизнес анализи, обслужване на клиенти, правни и финансови услуги. През годините компаниите и изследователите използваха идеи и модули от Watson за изграждане на по-специализирани системи, като фокусът се премести от едно общо демонстрационно приложение към по-насочени решения и комерсиализация.

Watson остава ключов пример за това как комбинацията от напреднали методи за обработка на естествен език, големи корпуси данни и машинно обучение може да постигне впечатляващи резултати, но и добра илюстрация на границите на такива системи при липса на истинско "разбиране" или непълни данни.

Служители на IBM тестват Watson.Zoom
Служители на IBM тестват Watson.

Въпроси и отговори

В: Какво е Уотсън?


О: Watson е изкуствено интелигентна компютърна система, която може да отговаря на въпроси, зададени на естествен език.

В: Кой създаде Watson?


О: IBM създаде Watson.

В: Каква беше целта на Watson в Jeopardy!?


О: Целта на Watson в Jeopardy! беше да се състезава с предишните шампиони Кен Дженингс и Брад Рътър.

В: Спечели ли Watson в Jeopardy!?


О: Да, Watson спечели наградата за първо място от 1 милион долара в Jeopardy!

В: На кого е кръстен Уотсън?


О: Watson е кръстен на Томас Джей Уотсън, който е бил председател и главен изпълнителен директор на IBM от 1914 до 1956 г.

В: Какви източници на информация използва Watson, за да отговори на въпросите?


О: Източниците на информация за Watson включваха енциклопедии, речници, тезауруси, статии и книги.

В: Беше ли свързан Watson с интернет по време на Jeopardy!?


О: Не, Watson не беше свързан с интернет по време на Jeopardy!, което означава, че трябваше да използва това, което беше в системата му, за да отговори на подсказките.


обискирам
AlegsaOnline.com - 2020 / 2025 - License CC3