Книга ChatGPT и Революция Искусственного Интеллекта - читать онлайн бесплатно, автор Тимур Казанцев. Cтраница 2
bannerbanner
Вы не авторизовались
Войти
Зарегистрироваться
ChatGPT и Революция Искусственного Интеллекта
ChatGPT и Революция Искусственного Интеллекта
Добавить В библиотекуАвторизуйтесь, чтобы добавить
Оценить:

Рейтинг: 0

Добавить отзывДобавить цитату

ChatGPT и Революция Искусственного Интеллекта

3. Профессиональный копирайтер

Так как ChatGPT – это текстовый бот на основе искусственного интеллекта, было бы странно, если бы он не справлялся с работой с текстом лучше всех. И поэтому большинство пользователей используют его для рерайтинга и копирайтинга.

ChatGPT может создавать эссе и сочинения, деловые и дружеские письма, рекламные объявления, отчеты, анекдоты и многое другое. Кроме этого, вы можете скинуть чату свой текст и попросить его сделать текст более формальным/неформальным, чтобы он звучал смешнее/остроумнее/мудрее, сократить или увеличить текст, сохранив основные моменты и идеи, или придать своему тексту определенный стиль.

4. Ваш личный коуч

Мы уже упоминали пример с пользователем, который попросил ChatGPT рассчитать его ежедневное количество потребления калорий и план питания для достижения необходимого ему результата.

Эту идею можно использовать практически с любой нишей, не только с нутрициологией. Например, вы можете создать инструмент или приложение: «Какой идеальный тип бизнеса для меня?», который будет задавать людям вопросы об их характере, опыте, и далее выдавать персонализированные бизнес-идеи, которые подойдут их бэкграунду.

5. Инструмент для создания ключевых слов

Предположим, у вас есть блог или сайт, который вы хотите раскрутить с помощью SEO оптимизации, т. е. использования ключевых слов, чтобы пользователи находили вас с помощью поисковых запросов. Вы можете попросить ChatGPT создать для вас список из 100 ключевых слов вокруг определенной тематики, и даже попросить предложить названия статей, которые можно было бы написать и разместить на этом сайте. Это можно использовать как для своего сайта, так и в качестве инструмента/сервиса, где вы помогаете другим пользователям подбирать ключевые слова для SEO оптимизации для их собственных проектов.

В России, например, такой сервис несомненно пользовался бы спросом для создания карточек для маркетплейсов, где часто используют ключевые слова для продвижения в поисковой выдаче.





6. Генератор слоганов и шуток

Мы уже упоминали, что ChatGPT в меру креативен и может в том числе генерировать и шутки и анекдоты, хотя иногда у него могут быть небольшие проблемы с иронией, сарказмом и чувством юмора, но попробовать точно стоит.

Так вот, один пользователь попросил ChatGPT придумать новый слоган для McDonalds, и вот что вышло:

Запрос: «Придумай новый, брутально честный слоган для McDonalds. Он должен быть также веселым»

Ответ ChatGPT: «Мы приготовим вашу еду так быстро, что она все еще может быть живой».

7. Генератор постов в соцсетях

Это уже очень сильно напоминает то, о чем многие говорят многие годы – про то, что современные соцсети заполонили боты. ChatGPT может писать тексты, притворяясь абсолютно разными личностями и используя различную тональность и фразы, подходящие для нужного вам контекста.

Например, один пользователь попросил его написать пост от имени обеспокоенной необразованной матери из южных регионов страны, которая паникует из-за роста популярности ChatGPT среди подростков.

И ChatGPT написал такой пост, в котором якобы мать призывает всех обратить внимание на то, что все злоупотребляют ChatGPT и она выступит с петицией запретить этот чатбот.



8. Генератор детских сказок и рассказов

Один пользователь поделился своей историей в статье, которую она озаглавила «ChatGPT произвел переворот в том, как я готовлю детей ко сну». Мать просила свою дочь предложить ей какую-то тему для рассказа, который она хотела услышать. После этого, мать вносила эти пометки в ChatGPT, который и создавал на основе этих подсказок полноценную историю для девочки. Вы можете создать такой же сайт для родителей, который будет выдавать истории на предложенные вами темы.

9. Интерактивные текстовые игры

Несмотря на бурный рост виртуальных и видео игр благодаря развитию технологий, простые текстовые игры также начинают приобретать популярность в противовес играм с супер графикой.

И ChatGPT может быть достаточно креативным в создании таких текстовых игр. Единственное ограничение здесь – это ваше собственное изображение. Вы можете накидать пару идей и правил, а ChatGPT сделает из них полноценную текстовую игру.




10. Создатель сценариев

Как и во всем текстовом креативе, ChatGPT показал хорошие результаты в создании сценариев для фильмов, пьес и книг. Вы можете предоставить ему основной посыл, или просто название, или вообще не предоставлять никакой информации, и ChatGPT выдаст вам готовый новый сценарий по своему усмотрению.



11. Служба поддержки клиентов

Некоторые компании уже начали инкорпорировать ChatGPT в свои чаты по поддержке клиентов. С учетом того, что сначала вы можете дать команду ChatGPT в каком формате отвечать на запросы, он может заменить всю вашу службу поддержки и снизить расходы.

Сервисы на основе ChatGPT

Бешеная популярность ChatGPT привела к тому, что практически сразу же стали появляться различные сервисы на его основе.

Вот здесь, например, (https://gpt3demo.com/) собраны более 500 кейсов использования ChatGPT и его предыдущей модели GPT-3 в различных проектах. Самые популярные варианты использования включают инструменты для: копирайтинга, написания email, создания рекламных объявлений, создания чатботов для компаний, генерации кода, создания баз данных, игр и т. д.

ChatGPT доступен в виде API, что позволит разработчикам легко интегрировать ChatGPT в свои приложения.

6 июля 2023 года OpenAI открыли доступ к API GPT-4 для всех пользователей API, успешно совершивших платеж в размере 1 доллар и более. По сообщениям компании, они «планируют открыть доступ для новых разработчиков к концу июля 2023 года, а затем начать повышать тарифные лимиты в зависимости от доступности вычислений»[3].

Прогнозируется, что как только профессиональная версия ChatGPT станет доступной для неограниченного круга пользователей, то это может стать настоящим толчком для появления тысяч новых приложений, на основе которых совсем скоро будут созданы многомиллионные стартапы. Это будет как появление AppStore или PlayMarket, но для приложений на основе ИИ.

Как установить и пользоваться Chat GPT

Возможно, вы уже поняли всю силу и перспективы этого мощного инструмента и захотели попробовать протестировать его самостоятельно. Это сделать достаточно просто. К сожалению, для пользователей из России, доступ к ChatGPT и другим продуктам OpenAI ограничен, но для тех, кто не боится препятствий, сделать это можно следующим образом.

1. Вам потребуется VPN.

2. Заходите на ChatGPT (https://chat.openai.com/chat) с включенным VPN и регистрируетесь.

3. Далее необходимо предоставить номер телефона, на который придет смс с кодом авторизации. Можно воспользоваться сервисами для предоставления временных номеров. В строке поиска можно ввести OpenAI, чтобы быть более уверенным, что этот номер сработает для получения смс для этой платформы.

4. Вводим номер телефона в форму на ChatGPT и в течение пары минут на сервисе номеров появляется сообщение с кодом подтверждения.

5. Вводим код подтверждения на сайте https://chat.openai.com/chat и все готово.

ChatGPT выглядит как диалоговое окно. Вы можете писать разные запросы в одном диалоге, либо для каждой тематики и для удобства выбрать отдельный чат (слева сбоку).

На данный момент сервис периодически работает с перебоями. Сами создатели указывали, что он находится в режиме тестирования, и основная цель на данном этапе – собрать обратную связь от пользователей.

В бонусной части к этой книге вы можете найти список из более 80 нейронок, большинством из которых можно пользоваться в том числе из России без подключения VPN.

Ограничения ChatGPT

ChatGPT – относительно новая технология, и модель не прошла еще достаточного обучения. Поэтому как и все новые технологии, у нее есть свои ограничения.

Уже на своей главной странице, разработчики ChatGPT предупреждают о следующих ограничениях в текущей версии:

– Иногда может генерировать некорректную информацию

– Иногда может предоставлять вредные инструкции или предвзятый контент

– Имеет ограниченные знания о мире и событиях после 2021 года



Что касается некорректной информации, то пользователи упоминали о следующих случаях:

– На вопрос «Что тяжелее: один килограмм воздуха или один килограмм железа», ChatGPT уверенно отвечал «килограмм железа», хотя очевидно, что один килограмм одного вещества равен одному килограмма любого другого вещества. Этот вопрос сразу же попробовали и другие пользователи, и для них уже ответ был, что оба весят одинаково.

Вот что еще один пользователь написал по поводу ChatGPT:

“Люди воодушевлены использованием ChatGPT для обучения. Как правило, он очень хорош. Однако, ты не можешь сказать, когда он ошибается, если только ты сам не знаешь правильного ответа. Я попробовал задать несколько базовых вопросов об информационной безопасности. В большинстве случаев ответы звучали правдоподобными, но по факту были полной чушью”.

Что касается вредного контента, то на большинство таких вопросов (например, изготовление оружия и пр), ChatGPT все же не отвечает, мотивируя это тем, что это может быть опасным и вредным, однако иногда с помощью дополнительных косвенных вопросов, некоторые пользователи могли найти то, что искали. В начале 2023 года создатели ChatGPT сообщали, что учли данную проблему и обещали не предоставлять вредные ответы.

Что касается ограниченности знаний о мире после 2021 года, то действительно ChatGPT был натренирован на массивном наборе данных, содержащихся в интернете на 2021 год, и поэтому если вы спросите эту модель о событиях, названиях компаний/продуктов/фильмов и пр, которые появились в 2022–2023 годах и позже, то она просто не сможет предоставить вам полноценный и актуальный ответ. Это одно из основных различий между тем же самым Google, например, что ChatGPT не может искать всю информацию онлайн прямо сейчас в момент получения вопроса от пользователя, а опирается только на тот массив данных и информации, на котором модель была обучена в 2021 году. Однако, есть очень весомые предположения, что в новых версиях, ChatGPT будет обладать возможностью доступа к актуальной информации онлайн.

Еще одним ограничением ChatGPT, по крайней мере на данный момент, являются частые технические неполадки и иногда приходится очень долго ждать ответа, что сами разработчики модели объясняют тем, что наблюдается большой поток запросов со стороны огромного количества пользователей. И действительно, ChatGPT – это большая и сложная модель с более чем 175 миллиардами параметров. Это может сделать его ресурсоемким в использовании и может ограничить его использование в определенных ситуациях. Например, может быть сложно запустить ChatGPT на устройстве с ограниченной вычислительной мощностью или памятью или в сценариях, где требуется анализ очень большого количества данных.

У ChatGPT могут наблюдаться сложности и с контектстным пониманием. Хотя бот способен понимать контекст слов и фраз в предложении, ему может быть сложно понять более сложные или абстрактные концепции или интерпретировать нюансы человеческого общения. Например, ChatGPT может испытывать трудности с пониманием иронии или сарказма или может создавать выходные данные, не соответствующие предполагаемой аудитории или контексту.

Все эти ограничения текущей версии ChatGPT говорят лишь о том, что он еще находится в своем начальном состоянии, и конечно же будут новые версии и поколения этой модели ИИ. Дайте ей пару лет, и я уверен, она будет выглядеть совсем по-другому. Вспомните первую версию IPhone и посмотрите на последнюю версию, которая доступна сегодня – разница колоссальна. То же самое будет и с 10-й и 100-й версией ChatGPT – он будет намного более мощен, производителен и функционален, чем сейчас. Не забывайте, что чередование поколений в машинах и компьютерах происходит намного быстрее, чем смена поколений у людей.

Экономические ограничения

Возникает резонный вопрос: «Раз ChatGPT такой умный и эффективный, почему он не установлен на всех наших смартфонах?»

И ответ, возможно, кроется в себестоимости.

Согласно некоторым подсчетам, такие масштабные языковые модели в современном их состоянии требуют огромных вычислительных мощностей. Они могут работать на относительно небольших масштабах – несколько миллионов пользователей. Но масштабировать эти модели до объема в несколько миллиардов запросов ежедневно пока еще не имеет экономической и пользовательской целесообразности: серверы станут слишком дорогими, а латентность (время ожидания или время, которое необходимо устройству, чтобы обеспечить выходную реакцию после события на входе. Латентность можно измерить, используя команду ping) станет достаточно высокой.

На данный момент один ответ ИИ стоит примерно от 10 до 100 обычных поисковых запросов в интернете. Согласно Сэму Альтману, CEO OpenAI, стоимость единичного ответа колеблется в одноразрядных цифрах (единицах, т. е. центах)[4]. Если предположим, что это 5 центов, а Google обрабатывает 8.5 миллиардов запросов в день, то это будет означать 425 миллионов долларов в день на обработку Искусственным интеллектом запросов в таком же масштабе, как делает это Google сегодня.

Именно по этим соображения, скорее всего, встраивание поиска с помощью ИИ на каждый смартфон пока не является экономически целесообразным для компаний, их разрабатывающих.

Однако, мы знаем на что способен Искусственный интеллект, и думаю, что в скором времени он сам сможет найти способы как оптимизировать эти массивные языковые модели, чтобы они стали еще более эффективными и экономически выгодными.

Кроме того, мы уже говорили, что OpenAI планируют выкатить более профессиональную платную версию ChatGPT, которая сможет покрывать расходы компании и сделать ее прибыльной. Бесплатная версия, возможно, будет инкорпорированной в поисковой сервис от Microsoft – Bing, и есть вероятность появления ChatGPT в виде мобильного приложения.

DALL-E, Stable Diffusion, Midjourney и другие генераторы изображений и видео на основе ИИ

Еще одной важной вехой в развитии ИИ стало появление в последние годы систем генерации изображений на основе текстовых данных. Среди таких можно, в первую очередь, выделить: DALL-E 2, Midjourney и Stable Diffusion.

Эти генераторы изображений используют алгоритмы машинного обучения и архитектуры нейронных сетей, чтобы научиться создавать реалистичные изображения, соответствующие входным данным, которые они получают от пользователя.

DALL-E 2 – это вариант оригинального генератора изображений DALL-E, который был разработан OpenAI в 2021 году. Это крупномасштабная языковая модель, которая обучается на массивном наборе данных изображений и текста и способна генерировать большое разнообразие изображений на основе заданной текстовой подсказки. Например, если написать запрос «жираф, играющий на пианино», DALL-E 2 может сгенерировать изображение жирафа, сидящего за пианино и положившего передние лапы на клавиши.

Кроме создания новых изображений с нуля, DALL-E может также вносить изменения в существующее изображение на основе вашего текстового пояснения, и создавать вариации существующего изображения.

Вновь созданные изображения могут иметь размеры 256х256, 512х512 или 1024х1024 пикселей. Чем меньше размер, тем быстрее создать новое изображение.

Например, при запросе «белый сиамский кот» выдает следующее изображение кота[5]:



Midjourney – аналогичный генератор изображений с искусственным интеллектом, который также был разработан OpenAI в 2021 году. Он обучается на наборе данных изображений и текста и способен генерировать широкий спектр изображений на основе входного текста. Он назван в честь идеи о том, что это «промежуточный этап» (с англ. midjourney) между оригинальными моделями DALL-E и GPT-3, поскольку он сочетает в себе элементы обоих.

Stable Diffusion – это еще один генератор изображений с искусственным интеллектом, разработанный исследователями Калифорнийского университета в Беркли в 2021 году. Он обучается на наборе данных изображений и текста и предназначен для создания широкого спектра изображений на основе входного текста. Он назван в честь идеи о том, что он способен «распространять» (от англ. diffuse) информацию о содержании изображения через свою сеть, что позволяет создавать более связные и реалистичные изображения.

Нейросеть от Сбера Kandinsky 2.1 и 2.2

Нейросеть от Сбера для генерации изображений Kandinsky 2.1 стала самым быстрорастущим сервисом в мире, достигнув 1 млн уникальных пользователей всего за 4 дня, и 2 млн пользователей за 6 дней. Напомню, что это быстрее результата сервиса ChatGPT от OpenAI, которому потребовалось пять дней, чтобы набрать 1 млн пользователей

Если брать техническую часть, то Kandinsky 2.1 – это обновленное поколение нейросети Kandinsky 2.0 для генерации картинок, которую Сбер запустил летом 2022 года. Новая модель сильно улучшена, она была обучена на 170 миллионах связок «текст-изображение». Kandinsky 2.1 содержит 3,3 миллиарда параметров, в то время как предыдущая модель Kandinsky 2.0 содержала только 2 миллиарда.

Основное отличие Kandinsky 2.1 от ее основных конкурентов Midjourney, Stable Diffusion и DALL-E, в том, что она способна понимать более 100 языков, включая русский, а также в том, что ее можно попробовать сразу на нескольких платформах:

сберовской облачной платформе ML Space

на fusionbrain.ai

На сайте Rudalle

в Telegram-боте

а также в мобильном приложении Салют и на умных устройствах Sber при помощи команды «Запусти художника».



Что нейросеть Kandinsky 2.1 умеет делать?

 самая стандартная функция – сгенерировать изображение на основе текстового запроса. Причем можно выбрать более 20 вариантов стилей, от ренессанса и классицизма до реальных 3д фотографий, киберпанка и советских мультфильмов

 нейросеть умеет смешивать несколько рисунков в один

 может дорисовывать изображения

 а также создать картину в режиме бесконечного полотна

Все четыре режима генерации пока доступны только в телеграм боте



Периодически в некоторых случаях нейросеть может не сработать, часто приходится долго ждать пока будет сгенерировано изображение, иногда появляются ошибки и на сайтах, и в телеграм-боте. Сбер объясняет это большой нагрузкой на сервис.

Из минусов – все картинки генерируются в разрешении 768 × 768 пикселей. Большее разрешение выставить нельзя, хотя современные нейросети уже рисуют картинки качественнее.

Как и в большинстве нейросетей, у Кандинского тоже иногда возникают проблемы при генерировании изображений людей, особенно если их несколько на картинке, и особенно прорисовка их пальцев, и когда они смотрят не прямо на вас, а в профиль.

Таким образом, если резюмировать, Kandinsky 2.1. – достаточно интересная нейросеть, которая может составить вполне себе конкуренцию Midjourney, Dall-E и Stable Diffusion.

Из плюсов – то что можно вводить промпты на русском языке и еще 100 других. Кроме того, нейросеть можно использовать через телеграм бот или даже голосовго помощника Сбера.

Из минусов – изображения относительно невысокого разрешения, прорисовка людей в определенных стилях, особенно если на картинке несколько персонажей, иногда оставляет желать лучшего.

Но в целом первое впечатление положительное, думаю буду пользоваться и дальше.

Вывод

Эти генераторы изображений с искусственным интеллектом могут революционизировать то, как мы создаем и потребляем изображения, поскольку они могут генерировать оригинальные изображения по запросу на основе вводимого текста. Это может иметь широкий спектр применений в таких областях, как реклама, искусство и дизайн, а также более практические приложения, такие как создание макетов продуктов или визуализация данных.

Использование генераторов изображений ИИ также может иметь экономические последствия, поскольку может изменить способ создания и потребления изображений. Например, если генераторы изображений ИИ получат широкое распространение, это может снизить спрос на традиционные методы создания изображений, такие как фотография или иллюстрация, что может повлиять на рынок труда в этих областях. Уже сейчас многие компании, дизайнеры и предприниматели вместо того, чтобы заказывать дизайн изображений, логотипов, визуализацию у профессиональных иллюстраторов и платить им за это десятки, сотни, а иногда и тысячи долларов, просто используют указанные модели на основе нейронных сетей и получают достаточно хорошие по качеству изображения бесплатно либо по намного сниженной цене.

В целом, появление генераторов изображений с искусственным интеллектом, таких как DALL-E 2, Midjourney и Stable Diffusion, представляет собой захватывающее развитие в области искусственного интеллекта и может изменить то, как мы создаем и потребляем изображения. Вполне вероятно, что эти технологии продолжат развиваться и совершенствоваться в ближайшие годы, и будет интересно посмотреть, как они определят будущее ИИ и экономики.

Кстати, уже начали появляться платформы, которые позволяют генерировать не только изображения, но и полноценные видео из текста. Это может быть видео говорящих людей или движущихся животных или автомобилей или чего угодно.

Видео, которые показывают как тот или иной аватар говорит по предоставленному вами скрипту, достаточно высокого качества. Например, сервисы Elai.io, интегрированный с GPT-3 от OpenAI, или Synthesia.io, в которых можно выбрать аватар того или иного человека или даже создать свой собственный аватар с помощью смартфона, который потом будет говорить по вашему тексту. Платформа поддерживает несколько десятков языков. Представьте как это упростит работу и сэкономит бюджет для компаний, предпринимателей, креаторов и блогеров, которые постоянно производят и постят новые видео или делают презентации своей компании или продукта.

По сути генерация видео не сильно отличается от генерации изображений, ведь видео это просто несколько кадров изображений в секунду, которые наш мозг воспринимает как динамичное видео. И поэтому если генераторы изображений могут создать качественные изображения, то мы можем попросить их создать несколько тысяч таких изображений с небольшими изменениями, чтобы из этого получилось полноценное видео. Это может сэкономить миллионы долларов для производителей видеоконтента, компьютерных игр и киностудий. А если это соединить с возможностью ChatGPT создавать полноценные сценарии, о которых мы уже упоминали ранее, и с искусственными синтезаторами голоса, то получается, что в скором времени мы можем попросить ИИ что-то наподобие следующего: «Создай мне 25-минутный фильм в жанре фэнтези с неожиданной концовкой» и через пару минут или даже раньше у нас будет готовый новый фильм, который еще никто не видел.

VALL-E и другие модели синтеза голоса на основе ИИ

Технология синтеза голоса предполагает, что компьютер умеет произносить речь как человек. Данная технология и рынок вокруг нее развиваются достаточно быстро: если в 2021 году объем рынка оценивался примерно в 7,5 млрд долларов, то прогнозируется, что к 2030 году он достигнет 60 млрд долларов, при ежегодном росте на 23 %[6].

Из крупных игроков на рынке можно выделить крупных игроков, таких как Google, IBM, Amazon, Microsoft, Сбер, Яндекс, VK, так и небольшие компании, как например Descript, Veritone, Respeecher и др.

Где могут применяться технология синтеза речи? Конечно же в голосовых помощниках, говорящих роботах, и ботах, звонящих клиентам по телефону. Кроме этого, эту технологию уже начинают использовать в озвучивании книг, фильмов, видеоигр, объявлений и рекламы, радио и новостных программ, а также для восстановления голоса умерших людей или людей, лишившихся способности говорить.