Новости

Все новости

30 августа 2024

Полное собрание школьника. Купите со скидками

7 августа 2024

Открытие интернет-магазина Дон Кихот

Статьи

Все статьи

ТОП-50 лучших книг 2024 года

Фирма вместо фермы. Вышли воспоминания экс-главы русского Universal

Незаслуженно забытый роман автора «Дракулы» Брэма Стокера «Тайна Моря»

«Слово пацана»: насколько вырос спрос на литературу о группировках 80-х и 90-х

Бестселлер The New York Times: «Дом Виндзоров: Правда и вымысел о жизни королевской семьи»

Максим Лапань: Глубокое обучение с подкреплением. AlphaGo и другие технологии

Издательство: Питер, 2020

Нет в наличии

Под заказ

Мы свяжемся с вами в самое ближайшее время и уточним условия заказа.

Цена действительна только для интернет-магазина и может отличаться от цен в розничных магазинах

Описание
Характеристики
Отзывы
Задать вопрос
Наличие

Описание

Эта книга — подробное руководство по новейшим инструментам глубокого обучения с подкреплением и их ограничениям. Мы реализуем и проверим на практике методы кросс-энтропии и итерации по ценностям (Q-learning), а также градиенты по стратегиям.Для экспериментов используются самые разные среды обучения с подкреплением (RL), начиная с классических CartPole и GridWorld и заканчивая эмуляторами Atari и средами непрерывного управления (на основе PyBullet и RoboSchool). Множество примеров основано на нестандартных средах, в которых мы с нуля разработаем модель окружения.В этой книге- Вы узнаете, какое место в контексте глубокого обучения занимают методы RL, реализуете сложные модели глубокого обучения.- Изучите основу RL: марковские процессы принятия решений.- Рассмотрите примеры реализации методов RL: метод кросс-энтропии, DQN, A3C, TRPO, PPO, DDPG, D4PG и других.- Узнаете, как работать с дискретными и непрерывными пространствами действий в различных средах.- Увидите, как разработать систему, обучающуюся играм Atari, используя обучение с подкреплением.- Создадите собственную среду по модели OpenAI Gym для обучения биржевого агента.- Реализуете метод AlphaGo Zero для игры в Connect4.- Познакомитесь с применением RL в обработке речи: узнаете, как обучить диалогового бота на фразах из кинофильмов.СвернутьЭта книга — подробное руководство по новейшим инструментам глубокого обучения с подкреплением и их ограничениям. Мы реализуем и проверим на практике методы кросс-энтропии и итерации по ценностям (Q-learning), а также градиенты по стратегиям.Для экспериментов используются самые разные среды обучения с подкреплением (RL), начиная с классических CartPole и GridWorld и заканчивая эмуляторами Atari и средами непрерывного управления (на основе PyBullet и RoboSchool). Множество примеров основано на нестандартных средах, в которых мы с нуля разработаем модель окружения.В этой книге- Вы узнаете, какое место в контексте глубокого обучения занимают методы RL, реализуете сложные модели глубокого обучения.- Изучите основу RL: марковские процессы принятия решений.- Рассмотрите примеры реализации методов RL: метод кросс-энтропии, DQN, A3C, TRPO, PPO, DDPG, D4PG и других.- Узнаете, как работать с дискретными и непрерывными пространствами действий в различных средах.- Увидите, как разработать систему, обучающуюся играм Atari, используя обучение с подкреплением.- Создадите собственную среду по модели OpenAI Gym для обучения биржевого агента.- Реализуете метод AlphaGo Zero для игры в Connect4.- Познакомитесь с применением RL в обработке речи: узнаете, как обучить диалогового бота на фразах из кинофильмов.СвернутьСвернуть

Характеристики

Объем, стр.	496
ISBN	978-5-4461-1079-7
Автор	Лапань Максим, Белов С., Синица К.
Переводчик	Белов С., Синица К.
Серия	Для профессионалов
Минимальный возраст	16+
Год издания книги	2020
Тип обложки	Мягкий переплет
Иллюстрации	Черно-белые
Вес, г	640г
Размеры	232х165х22 мм

Отзывы
Задать вопрос

Вы можете задать любой интересующий вас вопрос по товару или работе магазина.

Наши квалифицированные специалисты обязательно вам помогут.
Наличие

Розничный магазин (Натания, ул. Шмуэль-а-Нацив 13) тел: 052-274-85-74

Нет в наличии

Оставить отзыв

Задать вопрос

Персональные рекомендации