Изследователите на Google създадоха инструмент за изкуствен интелект, който може да генерира фотореалистични изображения въз основа на въвеждане на текст. Изследователите нарекоха своя инструмент „Imagen“ и съобщиха, че хората намират резултатите за по-реалистични от творенията на сравнимия инструмент DALL-E 2 от OpenAI.
Въз основа на описанието в текста Imagen може да генерира изображения† Можете да избирате между „маслена живопис“ или фотореалистична. Последното е по-трудно да се работи убедително с изкуствен интелект. Imagen се отличава с това, казват производителите.
Imagen работи на базата на голям предварително обучен езиков модел, като GPT-3. Този модел е „замразен“, според изследователите с най-добри резултати. След това текстът се маркира със знак дифузионен модел Преобразувайте го от случаен шум в изображение.
Първоначално Imagen създава малко изображение с размери 64 x 64 пиксела. Веднага Ултра фин дифузионен модел След това се увеличава до краен резултат от 1024 x 1024 пиксела. По този начин инструментът за изкуствен интелект може да създава завладяващи несъществуващи изображения въз основа на изречения като „Драконов плод с карате колан в снега“ И „Снимка на миеща мечка, облечена в каска на астронавт, гледаща през прозореца през нощта†
Изследователите публикуваха статия с Обяснение на работата на Imagine† В него те също сравняват своя AI инструмент с други инструменти за генериране на изображения. Според изследователите хората предпочитат творенията на Imagen.
Imagen не е първият инструмент за изкуствен интелект, който може да създава изображения въз основа на въвеждане на текст. OpenAI преди идваше с DALL-E 2† Според създателите това е инструмент, който може да създава реалистични изображения и изкуство въз основа на текст. DALL-E може също да направи две различни версии на съществуващи произведения на изкуството.
„Удобен за хипстър органайзер. Мислител. Комуникатор. Печелен с награди уеб нинджа. Типичен геймър. Зъл гуру на зомбитата. Фен на бирата.“