Пускането на ИИ “DEEP SEEK” доведе до неочаквани реакции и събития – ЗАЩО? Постига ли се наистина революция с този модел и повдига ли нови въпроси за надпреварата в разработването на технологията? Събеседник по темата ни е д-р Димитър Димитров, част от Института „INSAIT” към СУ „Св. Климент Охридски“:
“DEEP SEEK” е модел за разсъждение, трениран е да се опитва да разсъждава и да разбира дали дава вярна информация в реално време и да я поправя на място. По-скоро разсъждава сам със себе си. Предишните модели не правеха това, не се самопоправяха, с малки изключения. Разликата е, че те бяха затворени, а “DEEP SEEK” е отворен и можеш да го видиш как разсъждава.
Той е първият много добър отворен модел за разсъждение. Всяка негова стъпка има смисъл в контекста на математическия модел. Като цяло прави неща, които не правят другите. Много по-добър е за писане на код, прави малки апликации. Не е трениран да е многоезичен, още не е оптимизиран, най-добър е на английски.
Много от моделите, които се използваха бяха ориентирани да са фактически верни. Сегашният е различен, това е следващата стъпка - проверката дали разсъждението е вярно. “DEEP SEEK” е отворен модел и когато го използваш на собствен компютър, данните си остават твои, за разлика от предишните ИИ. Той ни позволява на нас като изследователи да правим фундаментални неща. Можем да го дообучаваме на нови данни, разбираме как работят отделните му "неврони".
За BG GPT импликациите от “DEEP SEEK” са големи. Той ще ни помогне да направим BG GPT по-добър. Когато моделите почнат да помнят всичките разговори с тях, това ще е различен вид опит."