Практический курс Google Gemini «Спросите это видео»: возможности YouTube в одно мгновение

В статье обсуждается новая функция Google под названием «Спросите это видео» в Google Discover and Search, которая использует искусственный интеллект для извлечения информации из видеороликов YouTube и предоставления быстрых ответов на запросы пользователей. Автор высоко оценивает потенциал Ask This Video, помогая пользователям находить точную и конкретную информацию без необходимости просмотра всего видео. Однако они также отмечают, что эта функция все еще нуждается в улучшении, поскольку она не всегда может давать полные или правильные ответы, особенно при работе со сложными видео или нюансами контекста. В статье приведены примеры, когда Ask This Video не смог найти правильный ответ или отклонился от темы. Автор выражает обеспокоенность по поводу потенциальных последствий неточных ответов ИИ и их влияния как на зрителей, так и на создателей видео. В целом, они призывают к более тщательному тестированию и зрелости, прежде чем публиковать Ask This Video для публики.


Вчера мы познакомили вас с новейшей функцией Google «Спросить эту страницу», представленной на I/O 2024. Сегодня мы рады изучить еще одну версию этой функции, специально разработанную для видео на YouTube.

Как и вчера, это ранний практический предварительный просмотр Ask This Video. Эта функция еще не реализована, но Android Authority удалось активировать ее в приложении Google. Итак, хотя мы пытались немного подтолкнуть его и посмотреть, на что он способен, а где он может потерпеть неудачу, еще есть возможности для улучшения, прежде чем Google выпустит его для широкой публики.

Близнецы спросите это видео: что это такое и как оно работает

Практический курс Google Gemini «Спросите это видео»: возможности YouTube в одно мгновение

Благодаря новой функции Ask This Video на базе генеративного искусственного интеллекта Gemini пользователи теперь смогут запрашивать конкретную информацию из любого видео YouTube, которое они смотрят, без необходимости перематывать назад или вперед различные части видео. Просто задав Gemini вопрос, связанный с видеоконтентом, ИИ попытается найти и дать ответ, не выходя за рамки видео, что делает процесс поиска более эффективным для пользователей.

При просмотре видео YouTube на телефоне Android вы можете запустить «Спросить это видео», нажав и удерживая кнопку питания, чтобы открыть Gemini. Поскольку Gemini теперь учитывает контекст, он распознает, что вы активировали его на YouTube, и отобразит во всплывающем меню надпись «Спросите это видео» для облегчения доступа. (Для пояснения обратитесь к изображению выше.)

Нажатие этой кнопки покажет, что Gemini добавила видео выше по вашему запросу. Теперь вы можете задавать вопросы в разговорной форме, а искусственный интеллект Google будет стараться давать соответствующие ответы. Время обработки ответа Gemini занимает примерно 6–8 секунд.

Спросите эту страницу иногда понимает нюансы

В приведенном выше примере вы можете видеть, что мы спросили Gemini о сообщении Android Authority: «Pixel 8a уже здесь, но «Почему» видео, в котором мой коллега С. Скотт Браун утверждал, что Pixel 8a — хороший телефон, но его ценность и конкурентоспособность уменьшаются из-за лучшего Pixel 8, на который часто продаются со скидкой. Но предположим, что вы не смотрели это видео и вам нужно в нескольких словах узнайте, что не так с телефоном, чтобы понять, стоит ли это смотреть (спойлер: это хороший контент). Вы можете сделать то же, что и мы, и обратиться к Gemini, чтобы узнать, что не так или плохо в Pixel 8a. И я думаю, что это в значительной степени уловило нюанс аргументации К. Скотта.

Практический курс Google Gemini «Спросите это видео»: возможности YouTube в одно мгновение

В недавнем примере я запросил у ИИ ключевые различия между Nothing Ear и Earbud (модель A). Вместо предоставления исчерпывающего списка в нем были выделены наиболее существенные различия и обобщена основная информация. Хотя в видео я обсуждаю эти особенности по-разному, ИИ правильно определил контекст и избежал ошибок в его сокращенной версии. Однако я считаю, что ответу все еще недостает полноты, поскольку есть и другие элементы, которые следует оценить при сравнении двух моделей наушников. Учитывая нынешний этап развития технологий обобщения ИИ, такой уровень точности можно считать успехом.

Спросите эту страницу, вы сможете найти ответ быстрее, чем вы сможете сказать «пропустить».

Практический курс Google Gemini «Спросите это видео»: возможности YouTube в одно мгновениеПрактический курс Google Gemini «Спросите это видео»: возможности YouTube в одно мгновение

 

С моей точки зрения, меня поразила способность Ask This Video быстро давать ответы на насущные вопросы, что позволяет мне не просматривать все видео, чтобы найти то, что мне нужно. Возможно, он пока не безупречен, но во время моего недавнего опыта работы с новыми трекерами Find My Device от Chipolo он точно определил, что для их использования не требуется никакого отдельного приложения. Точно так же в видеоролике Карлоса Рибейро «Мифы и правда» о быстрой зарядке Ask This Video правильно изложил его предложение использовать кабели мощностью 100 Вт для обслуживания гаджетов, ориентированных на будущее.

При сканировании видео в поисках ответов Ask This Video является многообещающим эффективным инструментом. Лично я стал полагаться на YouTube как на основной источник обучающих программ и практического контента из-за более высокого качества по сравнению с многочисленными написанными статьями, оптимизированными для SEO. Однако найти конкретную информацию, которая мне нужна, в длинных видеороликах может быть непросто. Раньше я обращался к расшифровкам видео на YouTube и искал соответствующие ключевые слова, чтобы быстро найти ответ. Ожидается, что Ask This Video значительно упростит этот процесс.

Google еще предстоит доработать Задать вопрос этой странице

В технологии искусственного интеллекта Google, включая Ask This Video, все еще существуют недостатки, которые необходимо устранить. Мы не преднамеренно тестировали ограничения системы и не «красную команду», а сосредоточились на типичных технических видеороликах и вопросах. Как только эта функция станет общедоступной, пользователи смогут обнаружить случаи, когда ответы являются неуместными, странными или неподходящими.

Практический курс Google Gemini «Спросите это видео»: возможности YouTube в одно мгновениеПрактический курс Google Gemini «Спросите это видео»: возможности YouTube в одно мгновение

Что касается наших предыдущих оценок, мы столкнулись с несколькими случаями, когда «Спросите эту страницу» не давали полностью точных ответов. В одном случае мы спросили его о мощности Pixel 8a и о том, существует ли более совершенный телефон, основываясь на моем видеообзоре устройства. В первом ответе Ask This Page рассматривалась только начальная часть видео, где я сравнивал 8a со старыми моделями (7a и 8), что привело к слишком положительной оценке нового телефона.

Хотя в представленной информации не было фактических ошибок, она не отражала полного контекста. Пытаясь перевести разговор на сравнительный сегмент видео, мы переформулировали вопрос, в результате чего обнаружили, что OnePlus 12R предлагает превосходные характеристики среди телефонов в том же бюджете.

Проблема заключается в том, что случайные зрители могут не обладать необходимым контекстом, в результате чего они принимают первоначальный ответ за чистую монету, не признавая последующих сравнений и не обнаруживая более компетентный телефон, доступный за ту же цену. Я обеспокоен тем, что это тот тип контекста, который обзоры ИИ будут постоянно игнорировать, пока они не улучшатся. Будучи начинающим YouTube-блогером, я сталкивался с многочисленными разочаровывающими комментариями от людей, которые не заметили тонкостей в моих видео из-за вводящего в заблуждение названия или введения и вместо этого критиковали меня за неточную информацию. Я беспокоюсь, что эти ошибочные ответы ИИ приведут к увеличению количества случаев недоразумений и неуместных обвинений.

Практический курс Google Gemini «Спросите это видео»: возможности YouTube в одно мгновение

В последнем случае Близнецы отклонились от точного ответа. Когда меня спросили о трех лучших аналоговых циферблатах среди десяти моих любимых вариантов для Pixel и Galaxy Watch, он предложил три варианта. Однако только один из них, «Ничего необычного», действительно является аналоговым лицом. Два других, «Sport XR» и «Material Stack», представляют собой цифровые проекты, несмотря на то, что последний явно не упоминается в видео. К сожалению, Gemini упустила из виду четко обозначенный «Аналоговый циферблат» и не распознала «Типограф», еще один упомянутый аналоговый вариант.

Однако признайте, что это не так катастрофично, как некоторые разочаровывающие результаты ИИ в поиске Google. Тем не менее, если могут возникнуть даже простые проблемы с циферблатом, следует задуматься о потенциальных сложностях со сложными и сложными видео.

На начальных этапах наших экспериментов мы сосредоточились на темах, связанных с технологиями. Тем не менее, YouTube представляет собой плавильный котел разнообразного контента, охватывающего политику, социальные темы, кулинарные уроки, спортивные события и многое другое. Несмотря на предупреждение Google о том, что Gemini могут предоставлять неточную информацию, люди часто доверяют полученным ответам без проверки. Неправильные ответы могут иметь пагубные последствия как для зрителей, так и для создателей видео, поскольку зависимость от Gemini растет.

Лично мне не нравится стратегия «действуй быстро, создавай проблемы, а потом ищи прощения», когда дело касается ИИ. Я считаю, что Google следовало провести более обширные тесты и дать ему возможность полностью развиться, прежде чем выпустить его для широкой публики. Однако финансовые спонсоры ставят прибыль выше удовлетворенности пользователей, поэтому эта тема требует дальнейшего изучения позже.

Смотрите также

2024-05-29 22:11