Apple совместно с Калифорнийским университетом выпустила модель искусственного интеллекта с открытым кодом MGIE.
Ее особенность состоит в том, что она редактирует фото из текстовых команд. MGIE использует мультимодальные модели большого языка (MLLM), чтобы понимать команды пользователей и одновременно распознавать объекты на изображениях на уровне пикселей.
Искусственный интеллект может изменять контраст, экспозицию, резкость, цветовой баланс, обрезать и вращать фото. Также он может выполнять сложные вещи, например редактировать только определенные участки на снимке.
К примеру, можно сказать «выдали женщину из заднего плана», после чего MGIE аккуратно вырежет человека и заменит его на другой фон.
MGIE может добавлять объекты. Если сказать «сделай ее здоровее», то MGIE добавит на фото пиццы помидоры и зелень.
Другой пример: если написать команду «сделай небо синее», то ІІ увеличит насыщенность неба на 20%.
MGIE доступен на GitHub, где кто-либо может найти код и предварительно обученные модели.
Также протестовать ИИ можно на сайте Hugging Face Spaces. MGIE поддерживает только английский язык, а выполнение команд сейчас занимает несколько минут из-за огромного наплыва пользователей на платформу. [VentureBeat]
iPhones.ru
Apple совместно с Калифорнийским университетом выпустила модель искусственного интеллекта с открытым кодом MGIE. Ее особенность состоит в том, что она редактирует фото из текстовых команд. MGIE использует мультимодальные модели большого языка (MLLM), чтобы понимать команды пользователей и одновременно распознавать объекты на изображениях на уровне пикселей. Искусственный интеллект может изменять контраст, экспозицию, резкость, цветовой баланс.
- До ←
Самые лучшие смартфоны до 50 тысяч рублей в 2024 году. Топ-6 моделей
- После →
10 классных штук на Яндекс Маркете, которые все пропустили. К примеру, ланч-бокс с подогревом