Обучение больших языковых моделей обходится невероятно дорого. Дело не только в количестве графических процессоров; важно и то, насколько эффективно их используют. И по мере масштабирования моделей даже небольшие потери времени и энергии могут превратиться в огромные затраты. Теперь группа исследователей из Массачусетского технологического института в сотрудничестве с такими компаниями,
как NVidia, заявляет, что нашла удивительно практичный способ высвободить вычислительные ресурсы, которые впустую тратятся во время обучения, — в некоторых случаях это позволяет сократить общее время обучения почти вдвое. Проблема, которую они пытаются решить, заключается в обучении с подкреплением (RL), особенно на так называемой фазе «внедрения». На этом этапе модель генерирует несколько вариантов ответов, чтобы научиться определять,
какие действия приводят к лучшим результатам. Это крайне важно для моделей обучения с подкреплением, ориентированных на рассуждения, но это также медленный процесс. Фактически, этап развертывания может составлять до 85% от общего времени выполнения. Виновником является то,
что исследователи называют «распределением с длинным хвостом» длительности ответов. Большинство сгенерированных ответов завершаются быстро. Но небольшое количество занимает гораздо больше времени, чем в среднем. Поскольку графическим процессорам необходимо синхронизироваться, более быстрые из них часто простаивают, ожидая завершения работы отстающих. Изображение Grok Решение команды из MIT, получившее название Taming the Long Tail (TLT), напрямую решает проблему неэффективного
использования ресурсов. Вместо того чтобы оставлять графические процессоры простаивать в течение длительных поколений, TLT использует это время простоя для обучения облегченной «черновой» модели в режиме реального времени. Эта уменьшенная модель непрерывно обучается на основе основной модели по мере продвижения обучения. Эта идея основана на
спекулятивном декодировании — методе, при котором меньшая модель предсказывает токены раньше основной модели, что позволяет проверять несколько токенов параллельно. Традиционное спекулятивное декодирование опирается на фиксированную черновую модель, которая быстро
устаревает по мере развития основной модели в процессе обучения с подкреплением. TLT меняет эту динамику. В экспериментах с использованием нескольких моделей обучения с логической ориентацией и реальных наборов данных результаты оказались значительными. Исследователи сообщают об ускорении обучения от 70%
до 210% по сравнению с сильными базовыми моделями, что фактически удваивает скорость обучения во многих сценариях. Важно отметить, что точность модели осталась неизменной.
Сообщает www.ixbt.com
Новость из рубрики: Технологии и Hi-Tech
Поделиться новостью:
Топ Новости Недели
- Доставка мебели из Китая...
- Отличный производитель сэндвич панелей - Компания МОСПАНЕЛИ...
- Летние шины 225/65 R17 - уверенность на каждом километре...
- Рождение точности: изготовление шпинделей...
- Аудит отчетности МСФО в Москве с DVP Audit...
- Канализационные трубы ПВХ и фитинги...
- Арматура с доставкой в Москве от Металл&Сталь...
- Ремонт промышленной электроники с компанией X Plata в Москве...
- Регистрация товарного знака в Казахстане с BROCS...
- Доставка экзотических фруктов из Таиланда с FRUITIQUE в Москве...
- Нетканый геотекстиль: невидимая основа долговечных решений...
- Aurus Residences - высота статуса в сердце Москва Сити...
- Качество Семяныча как ответ на неопределённость рынка...
- Искусство сияния: браслеты с драгоценными камнями...
- Погружение в мир Lineage 2: серверы, которые удивляют...
- Цветы - радость приходит к вашему порогу...
- Антигравийная пленка для авто в Минске...
- Комплексное оснащение лабораторий как основа точных решений и устойчивого развития...
- Переезд в другой город из Москвы без стресса и лишних забот...
- VIP Neva - комфортный трансфер и бизнес-такси в сердце Северной столицы...
15:17, 20 Фев Интроскопы: как эффективно выстроить систему безопасности на объекте Все, кто хоть раз был в аэропорту или на железнодорожном вокзале, видел интроскоп – устройство для бесконтактного автоматического досмотра багажа и л...
05:17, 14 Фев Ученые разработали экологически чистые кирпичи, используя пустынный песок в качестве замены портландцемента Ученые из Университета Шарджи сообщают об успешном преобразовании пустынного песка в строительные кирпичи, которые более экологичны, чем обычные цеме...
13:17, 30 Янв Обновил iPhone на iOS 26.2.1: как изменилась автономность и скорость работы Пара дней как Apple выпустила свежее обновление для iOS 26. В этот раз апдейт получился некрупным. iOS 26.2.1 не может похвастаться какими-то более-м...
09:17, 20 Фев Российские мужчины выбрали суперспособность для автомобиля. И это не скорость! Автомобильный маркетплейс Fresh перед 23 февраля выяснил, о какой «суперсиле» для машины мечтают его клиенты. В исследовании участвовали 7 тысяч води...
10:17, 04 Фев Вред ускоренного видео: как скорость 1,5–2x влияет на внимание и память Вы правда экономите время, ускоряя видео? Ответ врачей вас удивит. Смотреть видео, слушать голосовые и подкасты на скорости 1,5x или 2x кажется безоб...
10:17, 19 Фев Infinix представила доступный планшет XPAD 30E для обучения с ИИ-функциями Компания Infinix представила планшет XPAD 30E одновременно с серией смартфонов Note 60. Новинка ориентирована в первую очередь на студентов и предлаг...
00:17, 01 Фев Amazon нашла запрещённый контент с участием детей в данных для обучения ИИ Amazon обнаружила большое количество незаконных материалов с участием детей в данных, которые использовались для обучения её ИИ. Об этом говорится в ...
13:17, 02 Фев xAI нанимает известных писателей для обучения чат-бота Grok после череды скандалов xAI разместила вакансию, предлагающую писателям в различных жанрах — от медицинской документации до журналистики — оценивать, улучшать и создавать те...
12:17, 27 Янв Модели искусственного интеллекта испытывают трудности с простым умножением без специальных методов обучения В наши дни большие языковые модели способны справляться со все более сложными задачами, писать сложный код и применять изощренные рассуждения. Но ког...
13:17, 16 Фев Аптечный сервис становится более предсказуемым Выбираем лучший аптечный сервис Покупка лекарств перестала быть неопределенной: «Здравсити Аптека» создает единый стандарт обслуживания, где онлайн-и...
18:17, 02 Фев Minix Neo Z95 – настольный ПК объёмом чуть более 300 мл Компания Minix анонсировала ультракомпактный мини-ПК на базе процессора Intel N95 – Minix Neo Z95. Устройство выполнено в компактном форм-факторе и п...
04:17, 04 Фев Tesla выпустила более доступную полноприводную Model Y Tesla продолжает снижать порог входа для покупки своих электромобилей, выпуская более доступные версии. Недавно компания представила Model 3 за 29 00...
22:17, 15 Фев В Брянской области системы ПВО сбили более 170 БПЛА В Брянской области за 12 часов отражения атаки было сбито более 170 беспилотников самолетного типа, сообщил губернатор Александр Богомаз. Более 170 б...
15:17, 31 Янв Более 500 волонтеров Петербурга работали в блокадную декаду Как сообщил губернатор города Александр Беглов, во второй половине января более 500 активистов движения "Волонтеры Победы" стали "настоящим живым мос...
01:17, 28 Янв Apple готовит более 20 новинок к выпуску в 2026 году В 2026 году Apple планирует представить более 20 новых устройств, включая обновления для iPhone, iPad, Mac и Apple Watch, а также ряд уникальных прод...
18:17, 03 Фев Минюст США опубликовал более 3,9 тысячи файлов по делу Эпштейна Большинство из них представляют собой фото, на которых можно увидеть разных знаменитостей и политиков. Есть среди файлов и документы, а общий объём п...
07:17, 28 Янв Аппетит к риску помогает крипте стабилизироваться, но не более того Влияние на рынок:3Картина рынкаКапитализация крипторынка выросла на 0.67% за прошедший день до $2.99T. Быки стремятся использовать повышенный аппетит...
18:17, 19 Фев Более 45 жизненных ситуаций доступны брянцам на портале «Госуслуги» На портале «Госуслуги» доступен раздел с жизненными ситуациями, где собраны более 45 цифровых сервисов жизненных ситуаций. На странице можно подробно...
02:17, 29 Янв Более 38 000 сотрудников «Россети» прошли обучение в 2025 году В 2025 году профессиональную подготовку и повышение квалификации в компаниях прошли 38,2 тыс. сотрудников. Упор был сделан на развитие производственн...
17:17, 10 Фев За минувшую неделю жители Брянщины отдали мошенникам более 9 млн рублей УМВД России по Брянской области обнародовало статистику о дистанционных мошенничествах в регионе за прошлую неделю.Силовики констатировали, что актив...
15:17, 15 Фев Кинопарк "Москино" с начала года посетили более 100 тысяч человек Разнообразие развлечений привлекает как детей, так и взрослых: от зимних забав до увлекательных мастер-классов и театральных постановок. Одним из гла...
11:17, 09 Фев Простой пластырь может сделать лекарства более безопасными и эффективными Ванкомицин — это антибиотик, к которому врачи прибегают, когда почти ничто другое не помогает. Его используют в больницах для лечения серьезных инфек...
20:17, 10 Фев Более 200 новых площадок появятся во дворах Петербурга в 2026 году Масштабная работа ведётся в рамках городской программы "Петербургские дворы", темпы реализации которой в этом году будут увеличены почти в три раза п...
19:17, 04 Фев Директор МУП в Тверской области премировал себя любимого более чем на полмиллиона Директор, теперь уже бывший, муниципального предприятия «Жарковские городские коммунальные системы» посчитал свой вклад в работу предприятия недооцен...
15:17, 04 Фев За год диспансеризацию и профосмотры прошли более 760 тысяч жителей Тверской области В Верхневолжье в 2025 году диспансеризацию, включая углубленную и репродуктивную, а также профосмотры прошли 767 415 человек, из них 189 903 – дети. ...
11:17, 08 Фев Самый популярный кроссовер в России получит более тяговитый мотор Лидер продаж среди иностранных автомобилей в России, кроссовер Haval Jolion, ожидает серьёзное техническое обновление. Согласно свежему одобрению тип...
21:17, 28 Янв За год агропредприятия Тверской области получили более 3 млрд рублей на развитие В правительстве Тверской области сообщили, что в 2025 году на развитие агропромышленного комплекса региона из федерального и регионального бюджетов б...
03:17, 19 Фев Microsoft и Ericsson работают вместе для более глубокой интеграции технологий 5G в Windows 11 Компании Microsoft и Ericsson объявили о том, что они объединили усилия для улучшения 5G на компьютерах с Windows 11 и поддержкой ИИ. Новая инициатив...
10:17, 08 Фев Почему жесты руками делают речь более убедительной: что говорит наука Говорите руками — и вам будут верить больше: неожиданный вывод науки. Источник изображения: pinterest.com Мы привыкли думать, что убедительность зави...
13:17, 26 Фев Volvo отзывает более 40 тысяч электрокроссоверов EX30 из-за риска возгорания батареи Новый компактный кроссовер Volvo продолжает доставлять компании одну проблему за другой. Volvo объявила о глобальном отзыве более 40 000 автомобилей ...
03:17, 01 Фев Акция «Снежный десант» в Брянске собрала более тысячи неравнодушных жителей Акция «Снежный десант» в Брянске собрала более тысячи неравнодушных жителей. Об этом сообщили в пресс-службе мэрии. В пятницу, 30 января, в Брянске с...
13:17, 01 Фев Общественный транспорт Петербурга перевез более 1,72 млрд человек в 2025 году Пассажиропоток общественного транспорта Петербурга продолжает расти. Как сообщает городской комитет по транспорту, по итогам 2025 года автобусами был...
06:17, 31 Янв Добыча биткоинов, которую раскритиковал Илон Маск, станет более экологичной Илон Маск объявил на этой неделе, что Tesla приостановит прием биткоинов для покупки электромобилей, сославшись на потребление энергии криптовалютой....
01:17, 26 Фев Курская область получит более 4 млрд рублей федеральной поддержки для пострадавшего бизнеса Правительство России продолжит оказывать финансовую помощь предпринимателям Курской области, чья деятельность пострадала после событий августа 2024 г...
12:17, 27 Янв Использование микроволновых импульсов для устранения утечек в квантовых компьютерах делает их более надежными Ученые разработали новый подход к исправлению распространенных ошибок в квантовых вычислениях, который может проложить путь к созданию более надежных...
17:17, 07 Фев На шаг впереди: голосовой бот решает более 80% вопросов клиентов «Ростелекома» с помощью предиктивной модели «Ростелеком» внедрил в голосовой бот новую предиктивную модель, благодаря которой он в четырех из пяти случаев предугадывает тему обращения и автомат...
17:17, 29 Янв Более 6500 человек посетили ярмарки вакансий в 20225 году в Брянской области Более 6500 человек посетили ярмарки вакансий в 20225 году в Брянской области. Об этом сообщили в пресс-службе регионального правительства. 27 января ...
14:17, 17 Фев В Курской области после ДТП с 15-летним мотоциклистом требуют компенсацию более 1 миллиона рублей В Советский районный суд Курской области поступил гражданский иск о возмещении морального вреда и материального ущерба после дорожно-транспортного пр...
09:17, 13 Фев Меломаны дождались! Sony представила WF-1000XM6 — флагманские TWS-наушники с улучшенным звуком и более мощным ANC После двухлетней паузы Sony обновила свою премиальную линейку беспроводных наушников — WF-1000XM6 пришли на смену XM5 и сразу заявлены как лучшие TWS...
08:17, 01 Мар Китайский беспилотник более полугода вводил в заблуждение системы слежения над Южно-Китайским морем Международное информационное агентство Reuters обнародовало данные расследования, проливающие свет на масштабную и технически сложную операцию Вооруж...
03:17, 11 Фев «МАХ теперь дает возможность более доверительного общения». Валиева рассказала о мессенджере в своем телеграм-канале Российская фигуристка Камила Валиева рассказала о мессенджере MAX. «Друзья, январь у меня получился невероятно насыщенным – были и выступления в шоу,...
10:17, 10 Фев Курский филиал «Россети Центр» в 2026 году направит на ремонтную программу более полумиллиарда рублей В соответствии с утвержденными программами технического обслуживания и ремонта энергетики «Россети Центр» и «Россети Центр и Приволжье» проведут масш...
12:17, 04 Фев Более 60 моделей смартфонов Samsung Galaxy получили бета-версию One UI 8.5: опубликован полный список устройств Samsung вовсю тестирует свою новую оболочку One UI 8.5 на базе Android 16 QPR2. Публичное тестирование пока ограничено серией Galaxy S25, но на внутр...
01:17, 04 Фев Спать на кровати больше не модно: умные люди давно выбирают себе не кровать, а используют более комфортные вещи для сна pxhere.com Оказывается, спать на кровати — уже не обязательный пункт программы под названием «взрослая жизнь». Массивный каркас с громоздким изголовь...
20:17, 27 Янв Технологии, позволяющие роботам распознавать намерения человека, могут привести к созданию более безопасных, умных и заслуживающих доверия машин Роботы становятся частью нашей повседневной жизни, от здравоохранения до помощи на дому. Но для того, чтобы люди действительно доверяли им и сотрудни...
13:17, 07 Фев Директор «Юве» по маркетингу: «У нас 200 млн подписчиков в соцсетях, более 90% не из Италии. Я был бы самым счастливым в мире, если бы каждый дал по евро. Контент – драйвер привлечения фанатов» Директор «Ювентуса» по маркетингу Марко Кастелланета высказался о роли соцсетей в развитии клуба. «У нас довольно обширная и разнообразная фанатская ...
08:17, 15 Фев Слот о 3:0 с «Брайтоном»: «Игра более равная, чем показывает счет. Сегодня была возможность прессинговать, что в других матчах невозможно. АПЛ – не про розыгрыши, а про стандарты» Главный тренер «Ливерпуля» Арне Слот высказался о победе над «Брайтоном» (3:0) в 4-м раунде Кубка Англии. Нидерландца спросили о главном, по его мнен...
02:17, 13 Фев Опубликованы обзоры MSI GeForce RTX 5090 Lightning Z: потребление почти до 1000 Вт и превосходство над обычной RTX 5090 более чем на 10% Различные тематические ресурсы опубликовали свои обзоры видеокарты MSI GeForce RTX 5090 Lightning Z. напомним, это самая мощная версия RTX 5090, то е...
13:17, 07 Фев Кирилл Комбаров: «Карседо не тот, кто способен сделать команду чемпионом на долгие годы. Тренер «Спартака» должен быть выше уровнем, более амбициозным, обладающим чемпионским духом» Бывший защитник «Спартака» Кирилл Комбаров оценил перспективы Хуана Карлоса Карседо на посту главного тренера « Спартака ». – Лично с Карседо общалис...