Наука и технологии22

Искусственный интеллект уже через два года может исчерпать ресурсы из открытых источников

Источником для обучения новых моделей могут стать частные данные. Это позволит продержаться до конца десятилетия.

Artificial intelligence Штучны інтэлект Искусственный интеллект
Файл: vecteezy.com

Результаты нового исследования показывают, что системы искусственного интеллекта (ИИ) могут использовать все качественные общедоступные данные, которые размещены в интернете, в период между 2026-м и 2032-м годами, что может привести к относительной стагнации в этой области.

В своих оценках исследователи использовали веб-индекс Google. По их подсчетам, в настоящее время существует около 250 миллиардов веб-страниц, содержащих 7 КБ текста на страницу. Чтобы спрогнозировать рост доступного запаса данных, ученые провели анализ трафика интернет-протокола (IP) — потока данных в сети – и активности пользователей в интернете.

Расчеты показали, что информация из надежных источников закончится в лучшем случае к 2032 году, в худшем — уже через два года, в 2026-м.

Если рассматривать данные низкого качества, которые приводят к выдаче советов типа добавления клея в пиццу или употребления в пищу камней, как это было в случае с искусственным интеллектом Gemini от Google, который для ответов использовал посты на Reddit и статьи с сатирического сайта The Onion, то они закончатся между 2030-м и 2050-м годами.

Вопрос насчет способности разработчиков в условиях нехватки новых данных повысить эффективность своих моделей остается открытым. Авторы видят несколько возможных способов его решения.

Первый – использование частных данных. По словам одного из авторов исследования Пабло Вильялобоса (Pablo Villalobos) из центра Epoch IA (США), если компаниям удастся их использовать, и при этом ценность частных данных будет сопоставима с ценностью общедоступных данных, то вполне вероятно, что создатели ИИ продержатся до конца десятилетия.

Но использование частных данных, которые защищены авторским правом или правом на тайну личной жизни, может иметь юридические проблемы. Известны случаи, когда создатели контента подавали в суд на такие компании, как Microsoft, OpenAI и Stability AI, выражая протест несанкционированному использованию их текстов для обучения моделей ИИ. Решением проблемы могла бы стать выплата разработчиками нейросетей вознаграждения авторам контента.

Другим вариантом может быть использование синтетических данных – искусственно сгенерированных. Такие данные успешно применялись только в системах обучения играм, программированию и математике.

Исследователи отмечают, что недостаток данных — не единственная проблема на пути дальнейшего совершенствования ИИ. На нем есть и другие узкие места — рост энергопотребления, затраты на обучение и доступность оборудования. Так, по данным Международного энергетического агентства, поиск в Google с использованием ChatGPT потребляет почти в 10 раз больше электричества, чем традиционный.

Комментарии2

  • глеба
    27.06.2024
    Пры гэтым няма чалавека, які б прачытаў прынамсі адну мільённую ад усіх гэтых тэкстаў. Нават няграматны чалавек можа быць кемлівым, вынаходлівым і мудрым. Відавочна, што падыход да стварэння штучнага розуму мусіць быць іншы, чым проста агромністая база ўсіх тэкстаў.
  • жэўжык
    27.06.2024
    глеба, няграматнага чалавека ўсё ж такі навучаюць у школе. Тлумачаць, як адрозніваць тое, што мае сэнс, ад лухты. Калі дзіцёнку замест школы даць проста неабмежаваны інтэрнэт, то будзе катастрафічны вынік.

Сейчас читают

Бабарико о себе в 2020-м: Это не наивность. Не думаю, что такого кровожадного сценария кто-то ожидал67

Бабарико о себе в 2020-м: Это не наивность. Не думаю, что такого кровожадного сценария кто-то ожидал

Все новости →
Все новости

Российский зэк-военнослужащий обиделся на слово «опущенный» и расстрелял шесть сослуживцев25

В Польше начался суд над бандой наркоторговцев, которых российские спецслужбы нанимали для диверсий. Среди обвиняемых трое белорусов4

Местами до +13°С. Погода на последние дни зимы2

Lamborghini отменяет выпуск своего первого электромобиля: совсем нет спроса

Линдси Вонн рассказала, как ее ногу спасли от ампутации

«Не имеет значения, идет ли речь о Киеве или Валдае». Буданов высказался против ударов по «политическим центрам»5

Учредитель Gutenberg: Когда пришла новость о смерти Цимберова, многие забыли об осторожности и раскрылись8

Билл Гейтс признался в супружеских изменах с россиянками и в том, что Эпштейн его этим шантажировал13

Последняя представительница Беларуси на «Евровидении» пытается продать через аукцион старые джинсы7

больш чытаных навін
больш лайканых навін

Бабарико о себе в 2020-м: Это не наивность. Не думаю, что такого кровожадного сценария кто-то ожидал67

Бабарико о себе в 2020-м: Это не наивность. Не думаю, что такого кровожадного сценария кто-то ожидал

Главное
Все новости →

Заўвага:

 

 

 

 

Закрыць Паведаміць