Изследовател пуска прототип на холандски език, базиран на Microsoft Phi – IT Pro – Новини

Bram VanRooy е тук, създателят на Fietje. Също така създател на много от най-силните КОЗА УЛТРА.

За да избегна много негативни коментари: страхувах се, че потребителите ще направят сравнение с други по-мощни модели (като GOAT Ultra, Mixtrals, нови Llamas или дори ChatGPT). Това е разбираемо, но изобщо не е целта на Vietye! Fietje е 2,5 пъти по-малък от Ultra, така че бързо ще достигнете границите на знанията и уменията, които можете да натъпчете в един модел! Опитах се да подчертая това чрез различни описания, но ще го кажа отново: намерението не е да се улови ново състояние на напредък и това просто не е възможно в този мащаб. Целта винаги е била да има малък модел, който постига баланс между това да бъде възможно най-малък и все още полезен за някои задачи, например при хардуер от висок клас и изследвания в среда с ограничени ресурси, където внедряването на по-голям модел не е осъществимо. Вместо да създавам по-големи модели (което със сигурност е полезно), сега се фокусирам първо върху подобряването на достъпността на езиковите технологии. Разбира се, това е само една стъпка от процеса и ние ще продължим напред с нови проекти и идеи. Може би това ще бъде мелодия от Mixtral, или може би от Llama 3, или може би просто още един малък phi-3!

Помолих и автора да изтрие това изречение „Но бъдете толкова добри, колкото по-големият модел.“ И добавете следното в текста за пояснение: „Въпреки че Fietje В стандартите Работи почти толкова добре, колкото GEItje 7B Ultra, но всъщност е по-малко мощен. Следователно, той е предназначен като стъпка към стартиране на LLM локално, също и на малки устройства като Raspberry PI или телефон.“ Също така помолих автора да замени екранната снимка. Не е изненадващо, че Fietje не знае какво да прави: Има няма системно съобщение, така че е Тя не знае, че съм я направил, и тя не знае как е създадена/обучена, така че смята, че трябва да се преструва на журналист, който обича да тренира (във фитнеса например. ) Мисля, че тази екранна снимка е най-добрата, която показва, че Fietje може да създаде DnD герой за вас в JSON!

READ  Разработчиците са ядосани на Google заради липсата на комуникация относно спирането на Stadia – Игри – Новини

И накрая: Това, което намирам за много важно, е изграждането на общността и прозрачността. Така че наборите от данни, моделите, кодът за обучение и моята история на обучение Цялата публика Той е отворен за всички с надеждата да мотивира други изследователи да бъдат също толкова прозрачни и да работят заедно за подобряване на езиковата технология за нидерландския.

Ако имате някакви въпроси относно LLM, винаги можете да ги зададете по-долу. Нека го превърнем в забавни въпроси и отговори! Също така много ме интересува какво искате вие ​​като общност на Tweakers: колкото по-голямо, толкова по-добре, или да продължите да живеете ръб, край? Бихте ли ми казали!

[Reactie gewijzigd door BramVroy op 1 mei 2024 00:50]

Вашият коментар

Вашият имейл адрес няма да бъде публикуван. Задължителните полета са отбелязани с *