Книга Dezgo – рисующая нейросеть - читать онлайн бесплатно, автор Иван Сирфидов. Cтраница 3
bannerbanner
Вы не авторизовались
Войти
Зарегистрироваться
Dezgo – рисующая нейросеть
Dezgo – рисующая нейросеть
Добавить В библиотекуАвторизуйтесь, чтобы добавить
Оценить:

Рейтинг: 0

Добавить отзывДобавить цитату

Dezgo – рисующая нейросеть

5) Усиление «0.0» равноценно удалению слова, которое оно, ослабляет, из текста. Влияние слова на смысл текста прекращается. Порой это удобно – исправил циферку, параметр заработал, исправил снова на ноль, и он опять не действует. Однако нейросети не всегда благосклонно относятся к нулевому усилению. Пару раз, когда я его использовал, они вообще переставали реагировать на мой текст, выводя случайную простую картинку, никак с ним не связанную. Правда я использовал его относительно много раз, а вот таких сбоев было всего два.

6) Задавать дробную часть, если у нас усиление равно целому числу, необязательно. Мы можем спокойно писать «2» вместо «2.0» или «0», вместо «0.0».


Важно учитывать, что излишнее усиление может приводить к порче картинки – к порче и искажению её графики. Более всего характерно для обычных сетей, в XL выражено заметно слабее, там оно зависит конкретно от того, что за параметр усиливаешь, например, если цветность, с ней можно и переборщить, а если фантазию («fantasy» – слово, влияющее только на сюжет), ничего плохого в большинстве сетей не произойдёт, ну а в некоторых отдельных может быть качество графики и подупадёт, но не порядок. В многих обычных сетях всё равно что усиливать, при избыточном усилении картинка портится, и порой радикально, в них я принял себе за правило исходно не ставить более 3-х плюсов. Всего лишь трёх. Три никогда не приводили у меня к проблемам, 4 – сложно сказать, более 4-х уже значительно повышают вероятность сильно ухудшить графическое качество изображения. Тем не менее, гарантии, что это обязательно произойдёт, тоже нет, иногда и пять, и шесть плюсов у меня принималось как будто даже без мелких отрицательных последствий. Кстати, не стоит забывать о перерисовщиках. С их помощью некоторые испорченные переусилением изображения, если таковое всё же произошло, есть шанс нормализовать, как минимум те, у которых возникли проблемы с чёткостью, размазыванием цветов, шумами или зернистостью. Что касается минусов, ими можно пользоваться без каких-либо ограничений в каких угодно сетях. Картинку портит чрезмерное усиление, а они означают усиление всегда менее 1.


Функция flux усиление не поддерживает. Во всяком случае при моих экспериментах с ней реакции на усиление у неё было ровно ноль. Правда я проверял это именно в день её добавления в Dezgo, может быть со временем поддержку усиления в неё и добавят. Но по-моему скорее всего нет, она работает иначе, чем прочие функции Dezgo, более чётко реагирует на ваши тексты, есть ощущение, что она и не нуждается в усилениях.


О некоторых настройках подробнее


Текст для генерации картинок (промпты)

Здесь я чуть подробнее расскажу о настройке «prompt» функций. Той, в окно которой вы задаёте текст, описывающий контент генерируемой или перерисовываемой картинки. В русском сегменте интернета вследствие неё тексты для генерации картинок собственно и называют «промптами», только я бы не сказал, что для русского языка данное название удобно для произношения, далее я всё же преимущественно буду называть эти тексты «текстами». Или буду использовать слово «prompt» для уточнения. Когда моё руководство было уже практически готово, я вдруг заметил, что Dezgo осчастливил нас очередным новшеством – на его сайте появилась ссылка «Blog» (https://blog.dezgo.com). Перейдя по ней, я нашёл кое-что интересное, в том числе на тему текстов. И пришлось мне дополнять свою писанину ещё одной главой. Ну, тут я постараюсь быть максимально краток. В первую очередь стоит сказать, тексты, задаваемые ИИ (искусственному интеллекту) характеризуются длиной, и она измеряется в специальных единицах – так называемых «токенах». Кажется, этот термин используется для миллиона разных вещей, включая криптовалюты, так что не надо путать, тут у него иное значение. Токен – в данном случае это именно единица длины и ничего более, величину она имеет переменную, в среднем равняясь четырём символам, однако многие слова являются самостоятельными токенами (то есть любое из них любой длины равно одному токену). Почему это для нас важно? Потому что все генераторы изображений с искусственным интеллектом, основанные на Stable Diffusion (включая и Dezgo), имеют ограничение текстов по длине, после которого слова просто игнорируются. В настоящее время это ограничение составляет 77 токенов. Как определить число токенов в вашем тексте, раз они неизмеримы простыми средами (вы же не знаете, какие слова равны одному токену, а какие нет)? Dezgo предлагает вам для этого пользоваться специальным сайтом – онлайн токенизатором: https://novelai.net/tokenizer


Второй момент: словам в начале текста придается большее значение, чем словам в конце. Если вам не нравится получившаяся картинка, вы можете изменить порядок слов, а не менять текст полностью. В качестве примера на сайте приводятся две картинки – созданная по тексту «1 girl, classroom» и по «classroom, 1 girl». На первой картинке школьница крупным планом, на второй – школьный класс, где за одной из парт сидит школьница, то есть она гораздо более мелко нарисована, там она не главный объект, главный объект именно помещение класса.


Третий момент: если вы используете для генерации картинок сторонние тексты из интернета, составленные для других нейросетей (не для Dezgo), следует учитывать, что Dezgo не поддерживает их особый синтаксис вроде квадратных скобок, нескольких круглых скобок, и т.п. Проще говоря, в Dezgo в качестве специальных команд используются плюсики и минусики, а в других сетях применяются иные механизмы – где-то заключение в квадратные скобки, где-то в множество круглых «(((1 girl, classroom)))». В Dezgo все подобные специальные команды работать не будут.


Четвёртый момент: избегайте допускать грамматические и иные ошибки. Искусственный интеллект далеко не всегда сможет понять вас правильно. Лично по моему опыту часто ему всё равно, всё понимает. Но порой нет, например, я допустил опечатку в тексте «(Strangel world)+++. Strange nature» – лишнюю «L» поставил в тексте «странный мир, странная природа». И мне разные сети вместо странного мира стали генерировать изображение летящего примитивного (пропеллерного) самолёта.


Пятый момент добавлю от себя. Первая генерация по вновь заданному или вновь исправленному тексту иногда может происходить нестандартным образом, иным, чем в последующие. Потому если вы задали какой-то текст, и у вас первая картинка выпала интересная, а потом сколько попыток ни делаете, всё уже не то, вероятнее всего это не случайность, что именно первая была иная, это закономерность. Такое относительно редко бывает (с нестандартностью первого срабатывания), тем не менее бывает, это надо иметь в виду.


Ну и напоминаю, всё написанное вами в окне «prompt» будет сохранено непосредственно в файлах картинок (исключая формат WebP). Достаточно открыть картинку блокнотом, и в самом её начале вы обнаружите среди прочего текст, по которому она была сгенерирована.

Дополнительную информацию вы можете найти здесь:

https://blog.dezgo.com/2024/07/advanced-prompting-technique.html


Негативы

У шести из девяти функций Dezgo есть параметр «negative prompt», позволяющий указывать то, чего не должно быть на картинке. Причём у пяти из этих функций (за исключением только XL) он по умолчанию наполнен множеством значений, а именно:


ugly, tiling, poorly drawn hands, poorly drawn feet, poorly drawn face, out of frame, extra limbs, disfigured, deformed, body out of frame, blurry, bad anatomy, blurred, watermark, grainy, signature, cut off, draft


В переводе это: «некрасиво, черепица, плохо прорисованные руки, плохо прорисованные ноги, плохо прорисованное лицо, не в кадре, лишние конечности, изуродовано, деформировано, тело не в кадре, размыто, плохая анатомия, размытый, водяной знак, зернистый, подпись, обрезанный, черновик». Что такое «tiling» (черепица) мне непонятно, а по поводу остального, из всего, как видим, только «водяной знак», «подпись» и «лишние конечности» можно отнести к объектам, запрещённым к рисованию, прочее скорее призвано улучшать отрисовку чего-либо, а не запрещать. Всего в вышеприведённом примере фактически присутствуют 4 типа указаний:


1) Запрещать рисовать определённые детали.

2) Заставлять принудительно перерисовывать недостаточно качественно отрисованные детали.

3) Исправлять проблемы искажения анатомии, если они были допущены.

4) Помогать управлять размещением тел персонажей в кадре.


Так как проблемы с лишними конечностями периодически возникают (у меня такое регулярно случается), очевидно, что негативы не дают гарантии от появления указанного в них, видимо только понижают вероятность. Я пытался управлять с их помощью размещением персонажа в кадре, очевидных подтверждений, что это работает, не получил. Если оно вдруг и работает, то настолько нестабильно, избирательно и ненадёжно, что особо не о чем и говорить. В целом процент успеха у меня стремился к нулю. Хотя всё же был не нулевым. Также я пытался улучшать прорисовку каких-то деталей и исправлять искажения анатомии (именно перерисовывая уже полученные картинки, имеющие данные огрехи). Здесь положительные результаты у меня имели место, и достаточно часто, однако насколько они вызваны негативами, а насколько случайностью, трудно сказать. Всякий подобный огрех, это тоже в определённой мере случайность, при перерисовке он может устраниться сам собой, есть такая вероятность. Негативы отчасти равноценны тексту prompt, они тоже определяют в том числе какие-то случайные детали рисунка, нейросеть в том числе по ним выбирает оные детали. То есть картинка вследствие них будет изменена, а каким образом, зависит не только от их смысла, но и от случайности, от каких-то ещё факторов, управлять которыми нам не дано. Это надо понимать. Так или иначе, в целом они вроде очень удобны именно для исправления проблем анатомии. Я много раз устранял с их помощью лишние конечности. Сколько-то раз устранял искажения физиономии, сколько-то искажения формы конечностей. Проще всего исправлять такие огрехи не в функциях редактирования, а перерисовкой непосредственно в генераторе картинок с использованием свойства seed, о котором я расскажу в следующей главе.

Конец ознакомительного фрагмента.

Текст предоставлен ООО «Литрес».

Прочитайте эту книгу целиком, купив полную легальную версию на Литрес.

Безопасно оплатить книгу можно банковской картой Visa, MasterCard, Maestro, со счета мобильного телефона, с платежного терминала, в салоне МТС или Связной, через PayPal, WebMoney, Яндекс.Деньги, QIWI Кошелек, бонусными картами или другим удобным Вам способом.

Вы ознакомились с фрагментом книги.

Для бесплатного чтения открыта только часть текста.

Приобретайте полный текст книги у нашего партнера:

Полная версия книги