“DEEP SEEK” ще помогне за по-добър BG GPT

Пускането на ИИ “DEEP SEEK” доведе до неочаквани реакции и събития – ЗАЩО? Постига ли се наистина революция с този модел и повдига ли нови въпроси за надпреварата в разработването на технологията? Събеседник по темата ни е д-р Димитър Димитров, част от Института „INSAIT” към СУ „Св. Климент Охридски“:

Димитър Димитров

Update Required To play the media you will need to either update your browser to a recent version or update your Flash plugin.

“DEEP SEEK” е модел за разсъждение, трениран е да се опитва да разсъждава и да разбира дали дава вярна информация в реално време и да я поправя на място. По-скоро разсъждава сам със себе си. Предишните модели не правеха това, не се самопоправяха, с малки изключения. Разликата е, че те бяха затворени, а “DEEP SEEK” е отворен и можеш да го видиш как разсъждава.

Той е първият много добър отворен модел за разсъждение. Всяка негова стъпка има смисъл в контекста на математическия модел. Като цяло прави неща, които не правят другите. Много по-добър е за писане на код, прави малки апликации. Не е трениран да е многоезичен, още не е оптимизиран, най-добър е на английски.

Много от моделите, които се използваха бяха ориентирани да са фактически верни. Сегашният е различен, това е следващата стъпка - проверката дали разсъждението е вярно. “DEEP SEEK” е отворен модел и когато го използваш на собствен компютър, данните си остават твои, за разлика от предишните ИИ. Той ни позволява на нас като изследователи да правим фундаментални неща. Можем да го дообучаваме на нови данни, разбираме как работят отделните му "неврони".

За BG GPT импликациите от “DEEP SEEK” са големи. Той ще ни помогне да направим BG GPT по-добър. Когато моделите почнат да помнят всичките разговори с тях, това ще е различен вид опит."

По публикацията работи: Людмил Фотев

Последвайте ни и в Google News Showcase, за да научите най-важното от деня!

Горещи теми