Възможно ли е изкуственият интелект да прави проверка на фактите. За сега учените правят само проучвания по въпроса. Добромир Видев разговаря по темата с проф. Ирина Гуревич - един от водещите учени в сферата на обработката на естествен език. Тя е директор на Лабораторията за обработка на знания (UKP) в Техническия университет (TU) в Дармщат, Германия и президент на Асоциацията за компютърна лингвистика, както и съдиректор на програма в рамките на ELLIS - европейската лаборатория за обучение и интелигентни системи. Проф. Ирина Гуревич беше лектор на програмата ИНСАЙТ в София.
Наистина ли е възможно да се автоматизира процесът на проверка на фактите?
Мисля, че пълна автоматизацията в момента е невъзможна. Въпреки това можем да автоматизираме отделни стъпки, като например извличането на подходящи документи и търсенето на подходящ пасаж в документите. Дори и процеса на класифициране като подкрепящи или опровергаващи твърдението или може би неутрални. Постижимо е да са автоматизират подобни стъпки.
Тези задачи са сравнително лесни за машината. А и имаме търсачки с висока точност например за извличане на информация. Въпреки това, разсъжденията върху извлечените доказателства са много трудна задача дори за хората. А също така е много трудна за машините.
Това е доста трудно и за самите журналисти.
Вие всъщност извършвате много проверки на фактите в работата си. И това е подобно на работата, която извършват и алгоритмите при проверката на фактите.
Може ли да ми дадете примери как развивате тази автоматизация на процесите?
Разбира се, че използваме изкуствен интелект. Моята област е естествената обработка на машинен език. Така както за търсачките, има известно сходството между измерванията на твърдението, което е „на входа“ и документите, или изречението е в рамките на документите. Така че, ако изреченията са подобни, те се считат за подходящи. И тогава има втора стъпка на класификация. И тук обикновено използваме контролирано машинно обучение. Ние създаваме данни за обучение, където имаме случаи, които са обозначени от хората като подкрепящи или опровергаващи твърдението. И след това използваме тези данни за обучение, за да извлечем статистически характеристики, които ни позволяват класифицира нови данни, които пристигат. И така работи…..
А до каква степен може да бъде развита тази технология за автоматична проверка на фактите?
В днешно време всички говорят за големите езикови модели. Така че технологията напредва много, много бързо. Мисля, че тази технология може да улесни проверката на фактите по много начини. Технологията обаче има и огромен недостатък, тъй като знаем, че големите езикови модели са перфектни за генериране на фалшиви новини. И ние ги наричаме халюцинации. Освен това е голямо изследователско предизвикателство как да не позволяват на езиковите модели да халюцинират факти. Например по време на пандемията от КОВИД имахме твърдения, че хидрокси-хлоро-хин-а може да лекува. Това беше разпространено в социални мрежи. И някои хора възприемат тези твърдения за верни. Имаше случаи, в които това вещество е боло приемано. А хората са починали от него. Другият тип фалшиви новини всички знаем, че е например пропаганда относно войната, която се случва в Близкия изток. Така че в такива много емоционални настройки, тази дезинформация може да доведе до ескалация на конфликта и може да доведе до огромен брой убити. Или както беше със съобщенията за ударите по болницата в Газа.
Ние не знаем кое е истина или не. Обикновено в такива случаи моделът прави извод в рамките на най-простия случай - вярно невярно, или не знам. В по-напредналите модели те биха извели и вероятността това да е правилно или грешно, плюс обяснение защо. И това обяснение ще включва доказателствата. Така че потребителят може разбере как машината прави своя извод.
Така че крайната преценка зависи от потребителя. Без значение кой прави проверката на фактите – машина или човек, или група хора, или журналист.
Смятам, че технологията не е в степен на такава зрялост, която да вземе решението сама. Мисля, че крайното решение трябва да бъде на човека. И човекът, който дълго време би използва тази технология, може и да я персонализира, така че машината да може да учи от обратната връзка на потребителя. Например ако потребителят се доверява на определени източници, моделът може да го възприеме като доверен.
Проф. Гуревич, а как стои въпросът със изображенията?
Да. Изображенията в днешно време може да са силно подвеждащи, защото могат да бъдат заснети в един контекст и представени за достоверни в друг. И това ги прави много трудни за разпознаване от потребителя. След това има всички тези фалшиви изображения, които могат много лесно да бъдат генерирани в наши дни от технологията. Или изображения, които не са напълно ефектни, но които са модифицирани, за да представят неверни факти. За тяхното разпознаване има технологии, които се разработват. Но не мога сега да ви споделя. Но най- просото, което всеки потребител може да направи, е да постави изображението в търсачката на Google за изображения и по този начин можете да донякъде реконструира историята зад изображението. Можете да видите подобни изображения. И по този начин става по-лесно за да направите заключение дали изображението може да е истинско или не.
По какви проекти работите сега?
Първият проект е за твърдения в социалните медии. Твърдения, които са придружени от научна статия, която подкрепя твърдението. Обикновено, ако видим „научна статия“, смятаме, че щом науката е достоверна, няма да се наложи да отваряме статията. Ние смятаме, че твърдението е вярно, но всъщност твърдението е невярно. Има логическа заблуда, неправилно аргументиране, което свързва твърдението със съдържането на статията. Тези неправилни аргументи са описани в статии, посветени на проверка на фактите. И ние ги анализираме, за да разкрием тези заблуди. Това е нашето тренировъчно поле, за да изградим автоматичен инструмент, който може да намери тези заблуди в нови с известни такива случаи. Така че това е първият проект. Такива случаи има много в социалните медии. Аз не съм голям потребител на социални медии, просто ги ползвам от време на време. Но именно тези логически заблуди се използван доста често, за да се разпространява дезинформация.
Като учен това не ви ли плаши?
Да. Плаши ме до някаква степен. Особено сега, когато знам, че това се случва в света. Това е много, много смущаващо и пропагандата е изключително силна. Така че дори високо професионални потребители на информация не могат да оценят точно информацията. Така че това е много трудна задача.
Вторият проект е в мултимодална проверка на факти. Това е всъщност проучването ни за проверка на изображения. Макар че моята основната област на работа е обработката на естествен език и много често изображенията биха имали придружаващ текст, който може да използваме, за да разсъждаваме за изображението; но изображенията стават изключително широко разпространени. Много е лесно да направите снимка, за да генерирате снимка. А изображения може да предизвикат много емоции у хората, нали? Много бързо, защото не е необходимо прочетете дълга статия. Можете просто да погледнете изображението и ако видите ранени деца. Това веднага вашите емоциите експлодират. И резултатът от този продукт би трябвало да бъде инструмент, който помага за проверката на фактите, за да отговори на пет въпроса: за произхода, датата, съдържанието на изображението, за да се оцени достоверността и истинността зад изображението.
Проф. Гуревич, като учен можете ли да ми кажете вие лично, какво бихте посъветвали хората, които са доста по-чести потребители на социалните медии от вас?
Бих ги посъветвала да бъдат изключително внимателни с информацията, която те четат в социалните медии. Бих ги посъветвал да се постараят да получат известна цифрова грамотност. Как да оценяват съдържание, за да не бъдат подведени от някои кампании. За тази дигиталната грамотност мисля, че образователните институции носят отговорност. В германските училища децата получават обучение как да използват Уикипедия, как да ползват интернет. Това е добра практика.Полша ще изпрати свои военни представители в Украйна, които да бъдат обучени как да отблъскват атаки с дронове. Това обяви украинският президент Володимир Зеленски, ден след като Полша свали три руски безпилотни апарата над своя територия. Полша е поискала заседание на Съвета за сигурност на ООН, което ще се проведе утре вечер, съобщиха от..
45 деца са пострадали при катастрофи във Великотърновска област от началото на годината до края на август. Няма загинало дете в региона, отчетоха от полицията. Във Великотърновска област при катастрофи тази година са пострадали 252-а души. 18 на сто от ранените са деца. Само през лятната ваканция при пътни злополуки в региона са били ранени..
Европейската комисия не потвърди днес информацията, че утре ще бъде обявено съдържанието на 19-ия пакет от санкции срещу Русия заради войната й в Украйна. След завръщането от Вашингтон на координатора на Евросъюза за санкциите Дейвид O'Съливан говорител на Комисията беше лаконичен, че е рано да се каже кога ще бъде публикуван списъкът с..
Гласът на България ще бъде чут на заседанията на Европейската централна банка, увери управителят на Европейската централна банка Кристин Лагард след първото заседание след лятната ваканция. На него за първи път гуверньорът на БНБ Димитър Радев участва като наблюдател, а от 1 януари след въвеждането на еврото у нас, той ще има пълноправно..
Районният съд във Велико Търново остави в ареста насилник, който заплашвал жена си, че ще я запали и убие, а към отзовалите се полицаи отправил обиди и заплахи за убийство. Съдът постанови най-тежката мярка за неотклонение по искане на Великотърновската районна прокуратура за 65-годишният мъж, който е обвиняем за причиняване на лека телесна..
Много важен детайл е кои ще са хората, с които ще работи Ахмед Доган . Това обясни пред БНР Марчела Абрашева, регионален директор на международната социологическа агенция "Кантар", след като стана ясно, че той създава нова партия след разцеплението в ДПС. Името на втория му политически проект е "Алианс за права и свободи". Вече е сформиран..
Новият сезон на Народния театър "Иван Вазов" включва 13 премиери и участие в 10 международни фестивала. Първата премиера е във вторник (16 септември) - "Последният час на Мерилин Монро" с участието на Деян Донков, който е и режисьор, и младата актриса Анна Кошко. Текстът разказва за последната среща на американската филмова икона с нейния..
"Ще накараме институциите да работят. Всеки заслужава да има процес, който да му осигури истината". Това заяви пред БНР адвокат Методи Лалов,..
От инцидента в Русе няма да има голямо сътресение на правителството . Това каза пред БНР Тихомир Безлов, старши анализатор в Центъра за изследване на..
Владимир Путин и кликата му в Кремъл нямат желание за прекратяване на войната в Украйна , тъй като тогава ще настъпят много трудни времена за тези,..