新品互換用パソコンバッテリー、ACアダプタ、ご安心購入！

お問い合わせ

企業情報 |配送・送料について | お支払い方法

人気の検索: s10-li-144-5200 | poco x6 pro バッテリー交換| ps0011ua1brs

容量電圧製品一覧

+ 1800mah 14.4v

+ 2600mah 14.4v

+ 3300mah 14.8v

+ 3600mah 11.1v

+ 3600mah 14.4v

+ 3800mah 14.4v

+ 4000mah 11.1v

+ 4200mah 11.1v

+ 4400mah 10.8v

+ 4400mah 14.4v

+ 4400mah 14.8v

+ 4900mah 3.7v

+ 5400mah 11.1v

+ 8800mah 10.8v

スペシャル

ホーム » ニュース一覧 »Google、数千台のマシンに拡張可能な分散強化学習アーキテクチャ「SEED RL」発表！

Google、数千台のマシンに拡張可能な分散強化学習アーキテクチャ「SEED RL」発表！

強化学習では、ゲームなどの環境を探索しながら最適な行動を学習していく。複数の「Actor」による経験を「Learner」に送信し、モデルを更新していく強化学習の分散アーキテクチャでは、学習効率が高められる。

ただし、「IMPALA」といった、現行の分散強化学習アーキテクチャにはいくつかのボトルネックがあり、Googleが発表した「SEED RL」ではこれを解消しているという。

この新しい分散強化学習アーキテクチャでは、モデルでの推論を集中させてバッチ処理レイヤーを導入することで、計算コスト/通信量を削減し、数千台のマシンに拡張可能とのこと。

・モデルの推論を一括してLearner側のGPU/TPUで実行

環境内で経験をサンプリングするActorは、モデルで推論を実行して次のアクションを予測する。Actor自身で推論モデルを更新しつつ、経験が蓄積されるとこれをLearnerに送信。ここでモデルが最適化されてActorのモデルにも更新をかける。

Actor側での推論はCPUを使用して実行されるのが通常だ。また、Learnerで更新されたモデルのパラメーターは頻繁にActorに送信される。

SEED RLでは、モデルでの推論を一括してLearner側のGPU/TPUで実行し、パラメーターと状態をローカルに蓄えておくことで、効率よく学習を行う。

・CPUでのパフォーマンスがIMPALAの3～4倍に

非同期のSEED RLでは、ActorとLearnerのポリシー（報酬を最大化するための方策）のズレが大きいため、「V-trace」アルゴリズムによってこれを補正。反復学習を用いたQ-learning（将来的な報酬が最大になるようアクションを選択していく）手法「R2D2」なども統合されているようだ。

一般的に利用される学習環境でベンチマークテストしたところ、たとえばDeepMind Labでは、64コアのCloud TPUで毎秒240万フレームを達成。これはIMPALAの80倍の改善とのこと。また、CPUでのパフォーマンスもIMPALAの3～4倍改善され、大幅な学習効率の向上が示された。

Learnerが推論を一括して行うとのアーキテクチャは、GPU/TPUのスケーリングが容易で、Actorの数もスケーリング可能。自動運転や空調管理など現実世界を扱った最適化にも対応しやすいだろう。

2020-03-25 18:24:37

最近の投稿

人気のあるクエリ:
● kindle oasis バッテリー交換 ● nec ノートパソコンバッテリー互換 ● galaxy watch 4 ● hw0470360-a ● cr17335se-r ● n130bat-3 ● c330 バッテリー ● bt-wb1 ● app00169 ● br17335 ● nec ls150 バッテリー互換 ● pa5331u-1brs ● fire hd 10 互換バッテリー ● n750bat-4 ● pa5283u-1brs ● pb-42l ● glocalme u3 バッテリー交換 ● 50750-1018 ● jzsp-ba01 ● afp8801 ● fpcbp415 ● pa5136u-1brs ● br-agcf2w ● moto g8 バッテリー交換 ● pa5097u-1brs ● exa0901xh ● ab06xl ● adl170ndc3a ● pa5267u-1brs ● fpcbp342 ● vgp-bps38
ACアダプター: ●ACER ●DELL ●NEC ●TOSHIBA ●ASUS ●APPLE ●HP ●IBM ●LENOVO ●MICROSOFT ●SAMSUNG ●MSI
>>新着商品 >>人気商品 >>送料無料商品 >>ベストセラー商品

企業情報

当店はどこにも負けない高品質と低価格を約束します！
◎信頼できる国内PSE認証を得た。
◎配送時間をご指定頂けます（土日祝で出荷を止める）
◎ 一年保証

お支払い方法

PayPalでお支払い!

お支払い方法

保証と返品について

商品の交換・返品を希望される場合は、必ず商品未開封の場合、商品到着後7日間以内に、までご連絡ください。

配送・送料について

ご注文後は速やかに在庫を確保し、お届け希望日時のご指定の有無に関わらず、おおむねご注文日の当日または翌営業日に発送させていただいております。

企業情報 | 配送・送料について | 保証と返品について | お支払い方法 | お問い合わせ | サイトマップ

お得情報配信中:

Copyright © 2025 www.denchi-pc.jp . All Rights Reserved PCバッテリー・アダプター専門センター。

HP TPN-CA06 65W 充電器
税込:7320 円
TPC-BA50互換対応ACアダプター
税込:6696 円