OpenAI розкриває Dall-E 3, генератор зображень на основі Chatgpt, Dall-E 3: Fusion між Чатгптом та поколінням зображень, які похитнуть Midjourney

DALL-E 3: Злиття між Чатгптом та поколінням зображень, які похитнуть Midjourney

Інтегруючи DALL-E в Chatgpt, OpenAI зміцнює свою позицію як лідера у генеративному світі AI. Chatgpt та Dall-e 3 разом обіцяють відбити кордони AI.

OpenAI розкриває Dall-E 3, генератор зображень на основі чатгпта

Остання версія моделі заснована на GPT для полегшення створення складних та цілісних зображень.

OpenAI, компанія, що стоїть за Essential GPT, щойно розкрила свою останню генеративну модель на сьогоднішній день. І цього разу це знову зображення, яке знаходиться в центрі уваги; Війська Сема Альтмана виявили третю версію генератора зображень DALL-E. Він обіцяє Більше відтінків, деталей та складності.

Перший момент, підкреслений OpenAI, – це точність підказувати. Навіть найкращі генератори моменту, такі як Midjourney або DreamStudio, страждають від загальної проблеми: вони мають схильність ігнорувати певні слова текстового запиту.

Щоб отримати найкращі результати, тому необхідно Емпірично вчаться спілкуватися з алгоритмом. Це означає зробити багато тестів на словниковий запас і обертається, щоб знайти тих, хто, швидше за все, буде інтерпретовано правильно. Це вправа, яка може бути делікатною, коли користувач чекає дуже конкретного результату, отже, термін ” оперативна інженерна »».

Чатгпт мобілізувався для складу підказувати

З Dall-E 3, OpenAi хоче закінчити цей стан справ. ” Сучасні системи тексту до образу, як правило, ігнорують слова чи описи, які утворюють користувача, щоб дізнатися підказки. Dall-E 3 являє собою великий крок вперед у нашій здатності генерувати зображення, які саме дотримуються наданого тексту “Позначає компанію.

І для цього компанія вже має ідеальний інструмент: Чатгпт. Нова версія моделі Diffusion 3 – це ” Побудований »Навколо чату. Тепер він служить посередником для Інтерпретувати кожну деталь запиту. Мовна модель також може допомогти користувачеві генерувати підказувати Надзвичайно детально так, що Далл-е розуміє саме те, що від нього очікує без використання методів оперативна інженерна просунутий.

І якщо початковий результат не підходить, він цього не робить. Досить знову поїхати за чатгптом, щоб претендувати на точні зміни в кольорі, формі, стилі, конкретній деталі … іншими словами, Openai поклав невеликі страви у великі, щоб запропонувати a Максимальний ступінь контролю з Мінімум зусиль та технічної експертизи.

На прикладах, запропонованих OpenAI, також відзначте, що Dall-E 3 здатний генерувати когерентні тексти. Це те, що генератори зображень мали багато проблем, які роблять досі. Наприклад, остання версія Midjourney завжди дає достатньо … екзотичні результати, коли його просять займатися цією вправою.

Захистіть громадські діячі

Компанія все ще наклала на цю третю версію ряд обмежень. Наприклад, інженери консолідували гарантії, які вже присутні на DALL-E та DALL-E 2, які заважають користувачеві генерувати вміст ” насильницькі, дорослі або ненависні »».

Крім того, DALL-E 3 призначений для відмови від запитів, які чітко згадують про громадську діяльність. Мета полягає в тому, щоб запобігти її використанню для пропаганди або дезінформації.

Поважайте інтелектуальну власність

Інший важливий момент цього оновлення полягає в тому, що, здається, Optai взяв до уваги багато критики, які були адресовані різним генераторам зображень про інтелектуальну власність. Далл-е іде Відмовтеся від запитів, які просять його наслідувати стиль живого художника. Це повинно закрити двері до численних підроблених спроб.

З іншого боку, ця система захисту, безумовно, буде недосконала. Точність цієї третьої версії -це подвійний меч. Теоретично, достатньо сприйнятливий користувач завжди може отримати досить близький результат. Вам просто доведеться вміти описати стиль цільового художника дуже точно без чіткого імені.

OpenAI також пропонує два рішення, які дозволяють художнику відмовляйся від того, що його робота використовується для підготовки Далла-е. Перший – це заповнити форму за цією адресою. Але якщо ви хочете захистити велику кількість, як, наприклад, ті, що ви зберігаєте у своєму онлайн -портфоліо, ідеал полягає в тому. Для цього просто дотримуйтесь інструкцій, доступних за цією адресою.

Це значно обмежить здатність Dall-E 3 наслідувати відповідні твори. Принаймні, якщо вони ще не передані котушці. І, на жаль, неможливо визначити на практиці, оскільки вихідні дані не зберігаються після інтеграції в модель.

DALL-E3 буде офіційно запущений наступного жовтня для клієнтів Chatgpt Plus та пропозицій Chatgpt.

DALL-E 3: Злиття між Чатгптом та поколінням зображень, які похитнуть Midjourney

OpenAi, материнська компанія, більше не подавати. Після того, як запропонував нам чатгпт, вона тепер оголошує про здатність останнього генерувати точні зображення, завдяки злиття Далла-Е та Чатгпта в Даллі-е.

Фірдоїд, Для тих, хто слідкує, використовуйте інструмент для генерації зображень: Midjourney. Якщо цей інструмент виявився потужним та інноваційним у світі генерації зображень, Далл-е з OpenAI також був на трасі, з не менш вражаючим курсом. І новий опус Dall-e 3 ризик добре змінити ситуацію.

Згідно з демонстраціями, якими поділяється OpenAI, зрозуміло, що Dall-E 3 відрізняється від своїх попередників та конкурентів. Там, де Midjourney перевершує фотореалістичні реституції, але все ще вимагає багатьох маніпуляцій, Dall-E 3 обіцяє набагато ефективніше та менш помилкове генерація зображень. Помітний подвиг, особливо враховуючи той факт, що це головний прогрес порівняно з Dall-E.

Крім того, цей новий інструмент, здається, розробив конкретну компетентність для управління текстом на зображеннях, перевершивши потужність деяких його конкурентів, таких як стабільна дифузія XL та Deepfloyd. Зокрема, Openai підкреслює її здатність створювати переконливі образи букв, фігур і навіть людських рук (справжні труднощі для цих інструментів).

DALL-E 3 // Джерело: OpenAI

DALL-E 3 // Джерело: OpenAI

DALL-E 3 // Джерело: OpenAI

DALL-E 3 // Джерело: OpenAI

DALL-E 3 // Джерело: OpenAI

DALL-E 3 // Джерело: OpenAI

DALL-E 3 // Джерело: OpenAI

DALL-E 3 // Джерело: OpenAI

DALL-E 3 // Джерело: OpenAI

DALL-E 3 // Джерело: OpenAI

DALL-E 3 // Джерело: OpenAI

DALL-E 3 // Джерело: OpenAI

DALL-E 3 // Джерело: OpenAI

DALL-E 3 // Джерело: OpenAI

DALL-E 3 // Джерело: OpenAI

DALL-E 3 // Джерело: OpenAI

Інтегруючи DALL-E в Chatgpt, OpenAI зміцнює свою позицію як лідера у генеративному світі AI. Chatgpt та Dall-e 3 разом обіцяють відбити кордони AI.

Чат -боти не тільки зможуть перейти майже людським чином, але й уявити та створювати зображення з простих описів. Ми не можемо чекати тестування.

Якщо ви хочете перевірити Dall-E 3, він буде доступний для користувачів Chatgpt Plus та Enterprise. Що набагато простіше у використанні, ніж Midjourney … де вам потрібен клієнт розбрата.

Чатгпт

До кого створені зображення ?

Питання про авторські права, пов’язані із зображеннями, створеними AI, в даний час є гарячою темою. Поточні норми свідчать про те, що зображення IA входять у загальнодоступне домен. Однак OpenAi чітко заявляє, що властивість зображень, створених Dall-E 3, повертається до своїх творців. І це ще одна дискусія в цьому секторі.

Bing Cat також має право на Dall-e 3

Цього четверга, 21 вересня. Паралельно компанія повідомляла про приїзд моделі Dall-E 3 у творці Bing Image. Як нагадування, це інструмент створення зображень Bing Chat. За словами Microsoft, творця Bing Image ” Також розуміє, про що ви просите, що дозволяє отримати більш точні зображення. »»

Microsoft також каже, що йдіть далі, додавши ” Цифровий водяний знак, невидимий для всіх зображень, створених AI в Bing, включаючи час та дату їх створення. “Важко знати, наскільки потужним буде цей водяний знак, а також як ми можемо перевірити його присутність чи ні, але це перший крок.

Щоб слідувати за нами, ми запрошуємо вас завантажити нашу програму Android та iOS. Ви можете прочитати наші статті, файли та переглянути наші останні відео YouTube.