На этой странице представлены обновления API Gemini.
05 июня 2025 г.
- Выпущена
gemini-2.5-pro-preview-06-05
, новая версия нашей самой мощной модели, теперь с адаптивным мышлением. Чтобы узнать больше, см. Gemini 2.5 Pro Preview и Thinking .gemini-2.5-pro-preview-05-06
будет устарела 19 июня 2025 г.
20 мая 2025 г.
Обновления API:
- Реализована поддержка пользовательской предварительной обработки видео с использованием интервалов обрезки и настраиваемой выборки частоты кадров.
- Запущено использование многофункционального инструмента, который поддерживает настройку выполнения кода и привязку к Google Search в одном запросе
generateContent
. - Реализована поддержка асинхронных вызовов функций в Live API.
- Запущен экспериментальный инструмент контекста URL для предоставления URL-адресов в качестве дополнительного контекста для подсказок.
Обновления модели:
- Выпущен
gemini-2.5-flash-preview-05-20
, предварительная модель Gemini, оптимизированная для соотношения цены и производительности и адаптивного мышления. Чтобы узнать больше, см. Gemini 2.5 Flash Preview и Thinking . - Выпущены модели
gemini-2.5-pro-preview-tts
иgemini-2.5-flash-preview-tts
, которые способны воспроизводить речь с помощью одного или двух динамиков. - Выпущена модель
lyria-realtime-exp
, которая генерирует музыку в реальном времени. - Выпущены
gemini-2.5-flash-preview-native-audio-dialog
иgemini-2.5-flash-exp-native-audio-thinking-dialog
, новые модели Gemini для Live API с возможностями вывода собственного звука. Чтобы узнать больше, см. руководство Live API и Gemini 2.5 Flash Native Audio . - Выпущена предварительная версия
gemma-3n-e4b-it
, доступная в AI Studio и через API Gemini, в рамках запуска Gemma 3n .
7 мая 2025 г.
- Выпущен
gemini-2.0-flash-preview-image-generation
, предварительная модель для генерации и редактирования изображений. Чтобы узнать больше, см. Генерация изображений и Генерация изображений Gemini 2.0 Flash Preview .
6 мая 2025 г.
- Выпущена
gemini-2.5-pro-preview-05-06
— новая версия нашей самой мощной модели с улучшениями кода и вызова функций.gemini-2.5-pro-preview-03-25
будет автоматически указывать на новую версию модели.
17 апреля 2025 г.
- Выпущен
gemini-2.5-flash-preview-04-17
, предварительная модель Gemini, оптимизированная для соотношения цены и производительности и адаптивного мышления. Чтобы узнать больше, см. Gemini 2.5 Flash Preview и Thinking .
16 апреля 2025 г.
- Запущено кэширование контекста для Gemini 2.0 Flash .
9 апреля 2025 г.
Обновления модели:
- Выпущен
veo-2.0-generate-001
, общедоступная (GA) модель преобразования текста и изображения в видео, способная генерировать подробные и художественно нюансированные видео. Чтобы узнать больше, см. документы Veo . Выпущена
gemini-2.0-flash-live-001
— общедоступная предварительная версия модели Live API с включенной функцией выставления счетов.Улучшенное управление сеансами и надежность
- Возобновление сеанса: поддержание сеансов в рабочем состоянии при временных сбоях в работе сети. API теперь поддерживает серверное хранилище состояния сеанса (до 24 часов) и предоставляет дескрипторы (session_resumption) для повторного подключения и возобновления с того места, где вы остановились.
- Более длительные сеансы с помощью сжатия контекста: включите расширенные взаимодействия за пределами предыдущих временных ограничений. Настройте сжатие контекстного окна с помощью механизма скользящего окна для автоматического управления длиной контекста, предотвращая внезапные завершения из-за ограничений контекста.
- Уведомление о постепенном отключении: получение сообщения сервера
GoAway
, указывающего на то, что соединение скоро закроется, что позволяет выполнить плавную обработку перед завершением.
Больше контроля над динамикой взаимодействия
Настраиваемое обнаружение голосовой активности (VAD): выберите уровни чувствительности или полностью отключите автоматическое VAD и используйте новые клиентские события (
activityStart
,activityEnd
) для ручного управления поворотом.Настраиваемая обработка прерываний: решите, должен ли ввод данных пользователем прерывать реакцию модели.
Настраиваемое покрытие поворота: выберите, будет ли API обрабатывать все аудио- и видеоданные непрерывно или захватывать их только при обнаружении речи конечного пользователя.
Настраиваемое разрешение носителя: оптимизируйте качество или использование токенов, выбрав разрешение для входного носителя.
Более богатый вывод и функции
Расширенные параметры голоса и языка: выберите один из двух новых голосов и 30 новых языков для аудиовывода. Язык вывода теперь можно настроить в
speechConfig
.Потоковая передача текста: получайте текстовые ответы постепенно по мере их генерации, что позволяет быстрее отображать их для пользователя.
Отчеты об использовании токенов: получите представление об использовании с помощью подробных данных о количестве токенов, представленных в поле
usageMetadata
сообщений сервера, с разбивкой по модальности и фазам запроса или ответа.
4 апреля 2025 г.
- Выпущен
gemini-2.5-pro-preview-03-25
, общедоступная предварительная версия Gemini 2.5 Pro с включенной оплатой. Вы можете продолжать использоватьgemini-2.5-pro-exp-03-25
на бесплатном уровне.
25 марта 2025 г.
- Выпущена
gemini-2.5-pro-exp-03-25
, публичная экспериментальная модель Gemini с режимом мышления, всегда включенным по умолчанию. Чтобы узнать больше, см. Gemini 2.5 Pro Experimental .
12 марта 2025 г.
Обновления модели:
- Запущена экспериментальная модель Gemini 2.0 Flash, способная генерировать и редактировать изображения.
- Выпущен
gemma-3-27b-it
, доступный в AI Studio и через Gemini API, как часть запуска Gemma 3 .
Обновления API:
- Добавлена поддержка URL-адресов YouTube в качестве источника медиа.
- Добавлена поддержка включения встроенного видео размером менее 20 МБ.
11 марта 2025 г.
Обновления SDK:
- Выпущена общедоступная предварительная версия Google Gen AI SDK для TypeScript и JavaScript .
7 марта 2025 г.
Обновления модели:
- Выпущена в общедоступную предварительную версию
gemini-embedding-exp-03-07
— экспериментальная модель встраивания на основе Gemini.
28 февраля 2025 г.
Обновления API:
- Поддержка поиска как инструмента добавлена в
gemini-2.0-pro-exp-02-05
, экспериментальную модель на основе Gemini 2.0 Pro.
25 февраля 2025 г.
Обновления модели:
- Выпущена
gemini-2.0-flash-lite
— общедоступная (GA) версия Gemini 2.0 Flash-Lite , оптимизированная для скорости, масштабируемости и экономической эффективности.
19 февраля 2025 г.
Обновления AI Studio:
- Поддержка дополнительных регионов (Косово, Гренландия и Фарерские острова).
Обновления API:
- Поддержка дополнительных регионов (Косово, Гренландия и Фарерские острова).
18 февраля 2025 г.
Обновления модели:
- Gemini 1.0 Pro больше не поддерживается. Список поддерживаемых моделей см. в разделе Модели Gemini .
11 февраля 2025 г.
Обновления API:
- Обновления совместимости библиотек OpenAI .
6 февраля 2025 г.
Обновления модели:
- Выпущена
imagen-3.0-generate-002
, общедоступная (GA) версия Imagen 3 в API Gemini .
Обновления SDK:
- Выпущен Google Gen AI SDK для Java для публичного ознакомления.
5 февраля 2025 г.
Обновления модели:
- Выпущена
gemini-2.0-flash-001
, общедоступная (GA) версия Gemini 2.0 Flash , поддерживающая только текстовый вывод. - Выпущена
gemini-2.0-pro-exp-02-05
, экспериментальная общедоступная предварительная версия Gemini 2.0 Pro. - Выпущена
gemini-2.0-flash-lite-preview-02-05
— экспериментальная общедоступная предварительная версия , оптимизированная для повышения экономической эффективности.
Обновления API:
- Добавлена поддержка ввода файлов и вывода графиков для выполнения кода.
Обновления SDK:
- Выпущен общедоступный пакет Google Gen AI SDK для Python .
21 января 2025 г.
Обновления модели:
- Выпущена
gemini-2.0-flash-thinking-exp-01-21
, последняя предварительная версия модели, лежащей в основе Gemini 2.0 Flash Thinking Model .
19 декабря 2024 г.
Обновления модели:
Выпущен Gemini 2.0 Flash Thinking Mode для публичного ознакомления. Thinking Mode — это тестовая вычислительная модель, которая позволяет увидеть мыслительный процесс модели, пока она генерирует ответ, и выдает ответы с более сильными возможностями рассуждения.
Подробнее о режиме мгновенного мышления Gemini 2.0 читайте на нашей обзорной странице .
11 декабря 2024 г.
Обновления модели:
- Выпущен Gemini 2.0 Flash Experimental для публичного ознакомления. Частичный список функций Gemini 2.0 Flash Experimental включает:
- В два раза быстрее Gemini 1.5 Pro
- Двунаправленная потоковая передача с помощью нашего Live API
- Генерация мультимодального ответа в виде текста, изображений и речи
- Встроенный инструментарий с многооборотным рассуждением для использования таких функций, как выполнение кода, поиск, вызов функций и т. д.
Подробнее о Gemini 2.0 Flash читайте на нашей обзорной странице .
21 ноября 2024 г.
Обновления модели:
- Выпущена
gemini-exp-1121
, еще более мощная экспериментальная модель API Gemini.
Обновления модели:
- Обновлены псевдонимы моделей
gemini-1.5-flash-latest
иgemini-1.5-flash
для использованияgemini-1.5-flash-002
.- Изменение параметра
top_k
: Модельgemini-1.5-flash-002
поддерживает значенияtop_k
от 1 до 41 (исключая). Значения больше 40 будут изменены на 40.
- Изменение параметра
14 ноября 2024 г.
Обновления модели:
- Выпущена
gemini-exp-1114
, мощная экспериментальная модель API Gemini.
8 ноября 2024 г.
Обновления API:
- Добавлена поддержка Gemini в библиотеках OpenAI/REST API.
31 октября 2024 г.
Обновления API:
- Добавлена поддержка заземления с помощью поиска Google .
3 октября 2024 г.
Обновления модели:
- Выпущена
gemini-1.5-flash-8b-001
, стабильная версия нашей самой маленькой модели API Gemini.
24 сентября 2024 г.
Обновления модели:
- Выпущены
gemini-1.5-pro-002
иgemini-1.5-flash-002
, две новые стабильные версии Gemini 1.5 Pro и 1.5 Flash, для общего доступа. - Обновлен код модели
gemini-1.5-pro-latest
для использованияgemini-1.5-pro-002
и код моделиgemini-1.5-flash-latest
для использованияgemini-1.5-flash-002
. - Выпущен
gemini-1.5-flash-8b-exp-0924
для заменыgemini-1.5-flash-8b-exp-0827
. - Выпущен фильтр безопасности гражданской целостности для API Gemini и AI Studio.
- Реализована поддержка двух новых параметров для Gemini 1.5 Pro и 1.5 Flash в Python и NodeJS:
frequencyPenalty
иpresencePenalty
.
19 сентября 2024 г.
Обновления AI Studio:
- Добавлены кнопки «Нравится» и «Не нравится» для моделей ответов, чтобы пользователи могли оставить отзыв о качестве ответа.
Обновления API:
- Добавлена поддержка кредитов Google Cloud, которые теперь можно использовать для использования API Gemini.
17 сентября 2024 г.
Обновления AI Studio:
- Добавлена кнопка «Открыть в Colab» , которая экспортирует подсказку — и код для ее запуска — в блокнот Colab. Функция пока не поддерживает подсказки с помощью инструментов (режим JSON, вызов функций или выполнение кода).
13 сентября 2024 г.
Обновления AI Studio:
- Добавлена поддержка режима сравнения, который позволяет сравнивать ответы по моделям и подсказкам, чтобы найти наиболее подходящий вариант для вашего варианта использования.
30 августа 2024 г.
Обновления модели:
- Gemini 1.5 Flash поддерживает предоставление схемы JSON через конфигурацию модели .
27 августа 2024 г.
Обновления модели:
- Выпущены следующие экспериментальные модели :
-
gemini-1.5-pro-exp-0827
-
gemini-1.5-flash-exp-0827
-
gemini-1.5-flash-8b-exp-0827
-
9 августа 2024 г.
Обновления API:
- Добавлена поддержка обработки PDF .
5 августа 2024 г.
Обновления модели:
- Реализована поддержка тонкой настройки для Gemini 1.5 Flash.
1 августа 2024 г.
Обновления модели:
- Выпущена
gemini-1.5-pro-exp-0801
, новая экспериментальная версия Gemini 1.5 Pro .
12 июля 2024 г.
Обновления модели:
- Поддержка Gemini 1.0 Pro Vision удалена из служб и инструментов Google AI.
27 июня 2024 г.
Обновления модели:
- Выпуск общедоступной версии 2-мегапиксельного контекстного окна Gemini 1.5 Pro.
Обновления API:
- Добавлена поддержка выполнения кода .
18 июня 2024 г.
Обновления API:
- Добавлена поддержка кэширования контекста .
12 июня 2024 г.
Обновления модели:
- Gemini 1.0 Pro Vision устарела.
23 мая 2024 г.
Обновления модели:
- Gemini 1.5 Pro (
gemini-1.5-pro-001
) общедоступна (GA). - Gemini 1.5 Flash (
gemini-1.5-flash-001
) общедоступна (GA).
14 мая 2024 г.
Обновления API:
- Введено контекстное окно размером 2 Мп для Gemini 1.5 Pro (список ожидания).
- Введена оплата по факту использования для Gemini 1.0 Pro, а вскоре появится возможность оплаты для Gemini 1.5 Pro и Gemini 1.5 Flash.
- Введены повышенные лимиты скорости для предстоящего платного уровня Gemini 1.5 Pro.
- Добавлена встроенная поддержка видео в API файлов .
- Добавлена поддержка простого текста в API файлов .
- Добавлена поддержка параллельного вызова функций, который возвращает более одного вызова за раз.
10 мая 2024 г.
Обновления модели:
- Выпущена предварительная версия Gemini 1.5 Flash (
gemini-1.5-flash-latest
).
9 апреля 2024 г.
Обновления модели:
- Выпущена предварительная версия Gemini 1.5 Pro (
gemini-1.5-pro-latest
). - Выпущена новая модель встраивания текста
text-embeddings-004
, которая поддерживает размеры эластичного встраивания до 768.
Обновления API:
- Выпущен файловый API для временного хранения медиафайлов для использования в подсказках.
- Добавлена поддержка подсказок с текстом, изображениями и аудиоданными, также известных как мультимодальные подсказки. Чтобы узнать больше, см. Подсказки с медиа .
- Выпущены системные инструкции в бета-версии.
- Добавлен режим вызова функции , который определяет поведение выполнения при вызове функции.
- Добавлена поддержка параметра конфигурации
response_mime_type
, который позволяет запрашивать ответы в формате JSON .
19 марта 2024 г.
Обновления модели:
- Добавлена поддержка настройки Gemini 1.0 Pro в Google AI Studio или с помощью Gemini API.
13 декабря 2023 г.
Обновления модели:
- gemini-pro: Новая текстовая модель для широкого спектра задач. Баланс возможностей и эффективности.
- gemini-pro-vision: Новая мультимодальная модель для широкого спектра задач. Баланс возможностей и эффективности.
- embedding-001: Новая модель встраивания.
- aqa: новая специально настроенная модель, обученная отвечать на вопросы, используя текстовые отрывки для обоснования сгенерированных ответов.
Более подробную информацию см. в моделях Gemini .
Обновления версии API:
- v1: Стабильный канал API.
- v1beta: Бета-канал. Этот канал имеет функции, которые могут находиться в стадии разработки.
Более подробную информацию смотрите в разделе «Версии API» .
Обновления API:
-
GenerateContent
— это единая унифицированная конечная точка для чата и текста. - Потоковая передача доступна через метод
StreamGenerateContent
. - Мультимодальные возможности: Изображение — это новая поддерживаемая модальность
- Новые бета-функции:
- Вызов функции
- Семантический ретривер
- Ответы на вопросы (AQA)
- Обновленное количество кандидатов: модели Gemini возвращают только 1 кандидата.
- Различные настройки безопасности и категории SafetyRating. Подробнее см. в настройках безопасности .
- Настройка моделей пока не поддерживается для моделей Gemini (работа в процессе).