GPT-4 Turbo с новыми функциями

OpenAI презентовала модель GPT-4 Turbo — более мощную версию ChatGPT. Её базу обновили до апреля 2023 года, а в качестве запроса можно вводить промты до 128 тысяч токенов, что эквивалентно 300 страницам.

Производительность модели оптимизировали, поэтому стоимость входных токенов снизилась в три раза ($0,01), а выходных — в два раза по сравнению с GPT-4 ($0,03).

Обновления вызова функций GPT-4 Turbo

Опция позволяет описывать функции приложения или внешних API для моделей, а также выводить объекты JSON, содержащие аргументы для вызова этих функций. В одном сообщении можно вызывать несколько функций, например «открыть окно автомобиля и выключить кондиционер». Кроме того, GPT-4 Turbo с большей вероятностью будет возвращать правильные параметры функции.

Улучшено следование инструкциям и режим JSON

GPT-4 Turbo работает лучше при выполнении задач, требующих тщательного следования инструкциям, таких как создание определённых форматов (например, «всегда отвечать в XML»). Она также поддерживает новый режим JSON. Параметр API response_format позволяет модели ограничить вывод для создания синтаксически правильного объекта JSON. Режим полезен для разработчиков, генерирующих JSON в API Chat Completions вне вызова функций.

Воспроизводимые выходные данные и логарифмические вероятности

Новый начальный параметр обеспечивает воспроизводимые результаты, заставляя модель большую часть времени возвращать согласованные завершения. Эта бета-функция полезна при воспроизведении запросов на отладку и написании более полных модульных тестов. В ближайшие несколько недель также запустят функцию для возврата вероятностей журнала для наиболее вероятных выходных токенов, сгенерированных GPT-4 Turbo и GPT-3.5 Turbo.

Обновление GPT-3.5 Turbo

Новая версия GPT-3.5 Turbo по умолчанию поддерживает контекстное окно 16 КБ, улучшенное следование инструкциям, режим JSON и параллельный вызов функций. Приложения, использующие имя gpt-3.5-turbo, будут автоматически обновлены до новой модели 11 декабря. Доступ к более старым моделям будет по-прежнему возможен после передачи gpt-3.5-turbo-0613 в API до 13 июня 2024 года.

API-интерфейс Assistants, поиск и интерпретатор кода

API Assistants позволит разработчикам создавать ИИ-агенты в собственных приложениях. Они будут следовать конкретным инструкциям. API-интерфейс Assistants предоставляет новые возможности, такие как интерпретатор и извлечение кода, а также вызов функций. Одним из изменений, внесенных этим API, являются постоянные и бесконечно длинные потоки, которые позволяют разработчикам передавать управление состоянием потока OpenAI и обходить ограничения контекстного окна, добавляя новое сообщение в существующую цепочку.

Помощники также имеют доступ к вызову новых инструментов:

интерпретатор кода — пишет и запускает код Python в изолированной среде выполнения, может создавать графики и диаграммы, а также обрабатывать файлы с разнообразными данными и форматированием;
поиск — дополняет помощника данными домена, информацией о продукте или документами пользователей;
вызов функций.

Данные и файлы, передаваемые в API OpenAI, не будут использоваться для обучения моделей, и разработчики могут удалить их, когда сочтут нужным. API Assistants находится в стадии бета-тестирования и доступен всем разработчикам.

Новые возможности в API

GPT-4 Turbo способен принимать изображения в качестве входных данных в API Chat Completions, чтобы создавать подписи, анализировать изображения и читать документы с рисунками. Стоимость опции будет зависеть от размера входного изображения. Например, передача изображения размером 1080×1080 пикселей в GPT-4 Turbo стоит $0,00765.

Также разработчики могут интегрировать DALL·E 3 непосредственно в свои приложения и продукты через API изображений. Он предлагает встроенную модерацию.

Наконец, разработчики могут генерировать речь высокого качества из текста с помощью API преобразования текста в речь. Новая TTS предлагает на выбор шесть предустановленных голосов и два варианта модели: tts-1 и tts-1-hd. tts-1 оптимизирована для случаев использования в реальном времени, а tts-1-hd оптимизирована по качеству. Цены начинаются от $0,015 за ввод 1000 символов.

Экспериментальный доступ к тонкой настройке GPT-4

OpenAI выпустила экспериментальную программу доступа для тонкой настройки GPT-4 Custom Models, предоставляя отдельным организациям возможность работать с специальной группой исследователей компании для обучения модели в конкретной области. Такие модели не будут предоставляться или передаваться другим клиентам или использоваться для обучения.

Ранее сообщалось, что OpenAI предложит подписчикам ChatGPT функцию конструктора собственного чат-бота с функциями, которые поддерживаются GPT-4, в том числе просмотра веб-страниц и анализа данных.