Профессия будущего: как обучить нейросеть

Фото Yandex Qazaqstan
Фото Yandex Qazaqstan
Искусственный интеллект, нейросети, большие языковые модели. Yandex Qazaqstan сумел всё это объединить и создал новый продукт, который меняет привычный поиск.

Эксперты компании встретились со студентами университета AlmaU и наглядно показали и рассказали, как нейросети позволяют ускорить и улучшить процесс обучения, как устроена современная поисковая система, что такое LLM и как проходили запуски сервисов Yandex Qazaqstan на казахском языке. Этот воркшоп продолжает образовательную серию практических мастер-классов по ИИ для студентов, которые Yandex Qazaqstan начал проводить с октября 2024 года.

В зале собрались студенты, будущие предприниматели и пиарщики. Оно и понятно, ведь тема воркшопа была "Профессии будущего: как обучить нейросеть и запустить свою первую рекламу в интернете". 

Фото Yandex Qazaqstan

Поиск – это один из больших китов всей экосистемы Yandex Qazaqstan. Ежедневно он обрабатывает более 8 млн запросов казахстанских пользователей.

"Наша основная задача – максимально оперативно находить информацию для пользователей. Поэтому полтора года назад мы запустили быстрые ответы прямо под поисковой строкой. Не нужно переходить по ссылкам, а можно сразу получить результат", – рассказал директор по развитию Яндекс Поиска в Казахстане Улан Кайрбеков.

 

За последние 25 лет поисковые системы шагнули далеко. Появились новые функции, такие как умная камера, голосовой помощник, быстрые ответы и так далее. Но в 2022 году случился бум LLM.

За последние 25 лет поисковые системы шагнули далеко. Появились новые функции, такие как умная камера, голосовой помощник, быстрые ответы и так далее. Но в 2022 году случился бум LLM.

– Кто знает, что такое LLM? – поинтересовался Улан у студентов.

– Большая языковая модель, – ответил один из них.

– Верно. Думаю, многие из вас пользуются LLM, но вряд ли вы задумывались, как они работают.  

"Мы в Яндекс Поиске решили объединить большие генеративные модели и всю экспертизу по поисковым технологиям. И так на свет появился Яндекс Поиск с Нейро, который мы запустили в прошлом году. Нейро моментально проходит в поиске по всем источникам в Интернете, собирает нужную информацию и выдаёт краткий ответ со ссылками на источники. Вопросы можно задавать на казахском и русском", – пояснил Улан.

Фото Yandex Qazaqstan

"Буквально на днях мы запустили новые возможности Нейро – теперь можно задавать уточняющие вопросы в режиме диалога", – добавил Улан Кайрбеков.

Ещё одна особенность сервисов компании – это использование казахского языка. Число запросов на казахском языке постоянно растёт, сегодня их больше 20%.

"Нейро Яндекс может отвечать на казахском языке нативно, даже если на входе получает документы на английском языке. Одним из главных вызовов для нас было недостаточное количество контента на казахском языке на некоторые темы. Например, человек спрашивает на казахском, какие виды водорослей обитают в Средиземном море. К сожалению, такой информации на казахском нет, но зато есть информация на английском. И Нейро на основе этих материалов даёт ответ на казахском языке. Вторая проблема – это понимание контекста в омонимах. Казахский язык очень богат на омонимы. Они имеют значение в зависимости от контекста.  Важно понимание пословиц, стихов и песен. Например, запрос на казахском "Аягөз қайда барасың?" переводится как "Куда ты идёшь, Аягоз?". Ранние версии Нейро выдавали ответы про реку Аягоз или город в Абайской области. А на самом деле пользователь просто хотел послушать песню с таким названием. Сейчас мы работаем над этим", – рассказала ведущий продуктовый менеджер Яндекс Поиска Салтанат Болатбекова.

В своём выступлении Салтанат также рассказала, как устроены поисковики, как LLM применяется в сервисах компании. 

Фото Yandex Qazaqstan

"Сейчас когда большинство компаний говорят про ИИ, они говорят с фокусом на LLM. Машинное обучение – не только про генерацию контента. Есть разные типовые задачи. И если мы разберём, то поймем, что эти технологии существуют давно и используются для разных задач. Например, есть задача регрессии – это модель, которая прогнозирует на основе данных, что будет следующим шагом. Например, стоимость нефти, или сколько поступит студентов в следующем году в AlmaU, или сколько будет стоить товар, если средняя цена на этот товар такая-то. Развитие поисковых систем переживало разные этапы. Сейчас такие этапы проходит развитие генеративных технологий", – считает Салтанат. 

Завершила воркшоп руководитель стратегических партнерств Yandex Ads Ольга Курданова, которая на игре квиз показала, что такое контекстная реклама и как запустить свою первую рекламную кампанию в интернете.

Фото Yandex Qazaqstan

Лучший результат показала студентка Аруна, которая ответила на все вопросы правильно. За что и получила подарок.

В процессе вопркшопа студенты задавали много вопросов спикерам.

Фото Yandex Qazaqstan

Два самым интересных вопроса от Эрики Ким и Родиона Дубровина были отмечены призами. Студенты получили в подарок умные колонки "Станция Лайт 2" с виртуальным ассистентом Алисой.

Фото Yandex Qazaqstan

 

Популярное в нашем Telegram-канале
Новости партнеров