outofscope:2025-02-03
差分
このページの2つのバージョン間の差分を表示します。
| 両方とも前のリビジョン前のリビジョン次のリビジョン | 前のリビジョン | ||
| outofscope:2025-02-03 [2025/02/03 11:33] – atnmn | outofscope:2025-02-03 [2025/02/03 13:12] (現在) – atnmn | ||
|---|---|---|---|
| 行 1: | 行 1: | ||
| - | ====== 生成AI ====== | + | ====== 生成AIってのは |
| DeepRacerに励んで約5年、アナログどっぷり人間にしては、予想のほか強化学習について考える時間が蓄積された。最初はなんのことかさっぱりわからないままAWSコンソールの最低限の操作方法だけを教わって最小限の操作で遊んでいたが、だんだん興味の範囲が広がってゆくにつれ思いついたアイデアや興味に引きつられるようにその界隈の書籍などもAmazonでポチっては斜め読むを繰り返し、徐々にAIってなんでAIなんだってあたりのおぼろげなシルエットがほわわんと意識の中に形作られてきた。\\ | DeepRacerに励んで約5年、アナログどっぷり人間にしては、予想のほか強化学習について考える時間が蓄積された。最初はなんのことかさっぱりわからないままAWSコンソールの最低限の操作方法だけを教わって最小限の操作で遊んでいたが、だんだん興味の範囲が広がってゆくにつれ思いついたアイデアや興味に引きつられるようにその界隈の書籍などもAmazonでポチっては斜め読むを繰り返し、徐々にAIってなんでAIなんだってあたりのおぼろげなシルエットがほわわんと意識の中に形作られてきた。\\ | ||
| そんな中、ここ数年でAIが機械らしからぬ生々しいリザルトを返すと世間がざわついた生成AIが登場する。ネット界隈ではしばらく前から話題ではあったものの、世間全体がこれに気づいたのはほんとここ1~2年のことのように思う。\\ | そんな中、ここ数年でAIが機械らしからぬ生々しいリザルトを返すと世間がざわついた生成AIが登場する。ネット界隈ではしばらく前から話題ではあったものの、世間全体がこれに気づいたのはほんとここ1~2年のことのように思う。\\ | ||
| 行 11: | 行 11: | ||
| たとえば自動運転。道路や障害物の状況に合わせて、ハンドルを何度切るか/アクセルやブレーキをどの程度踏み込むか。。。たとえば道路が左に曲がっていてもそれがゆるいカーブなら左に寄って回るが、急カーブだったらカーブ手前では道路右に寄ってから回り込むのが良いかもしれない。また、前方に障害物があればその動きを予測して自分と衝突しない軌道を予測して操作を選ぶことになる。こういった複雑な状況と複雑な判断の結果、シンプルな出力を求めるようなケースにおいては、判断パターンが無数にあり、学習用データを用意することは現実的ではない。こういうケースはモデルの選択に「点数をつける」形で学習の拠り所にする。モデルに入力されるデータとそこからモデルが導く選択について、点数をつける。左カーブでそれがタイトなら、まず右に寄ることを高評価とするが、それほどタイトでないなら左寄りのほうが高評価になるようなロジックをつくり、このロジックをつかった点数付けをもとにモデルに学習をさせる。それによってモデルは求められる判断を体得してゆく。こういう学習アプローチを深層学習と呼ぶ。 | たとえば自動運転。道路や障害物の状況に合わせて、ハンドルを何度切るか/アクセルやブレーキをどの程度踏み込むか。。。たとえば道路が左に曲がっていてもそれがゆるいカーブなら左に寄って回るが、急カーブだったらカーブ手前では道路右に寄ってから回り込むのが良いかもしれない。また、前方に障害物があればその動きを予測して自分と衝突しない軌道を予測して操作を選ぶことになる。こういった複雑な状況と複雑な判断の結果、シンプルな出力を求めるようなケースにおいては、判断パターンが無数にあり、学習用データを用意することは現実的ではない。こういうケースはモデルの選択に「点数をつける」形で学習の拠り所にする。モデルに入力されるデータとそこからモデルが導く選択について、点数をつける。左カーブでそれがタイトなら、まず右に寄ることを高評価とするが、それほどタイトでないなら左寄りのほうが高評価になるようなロジックをつくり、このロジックをつかった点数付けをもとにモデルに学習をさせる。それによってモデルは求められる判断を体得してゆく。こういう学習アプローチを深層学習と呼ぶ。 | ||
| - | この深層学習でつくられ | + | この深層学習で作られるモデルの内部は基本的に2つのプロセスに別けられる。前半の処理として、カメラなどから入ってくる画像データから特徴点を抽出する処理。画像の中に写っているオブジェクトを認識するプロセス。後半の処理でこの特徴点がこの状態で在るならば、どういう分類が適切なのかの分類を行い、最終的な出力を確定させる。\\ |
| + | 前半の処理をもうすこし具体的に説明する。カメラには人が写っているとする。その画像を入力としたときに、AIモデルはその処理の内部で人らしきオブジェクトを認識する。つまり、「人の画像→人という認識」の処理ができている状態。この、前半処理の部分を切り取り、この処理の出口と入口をひっくり返すことによって、「人という認識→人の画像」という処理が(理論上)できることになる。\\ | ||
| + | モデルが「これは人だ」と認識できる人の画像は様々で、大人でも子どもでも白人でも黒人でも男性でも女性でも、あらゆる人間の像をみて「これは人だ」と認識できる。これをひっくり返して「人である」というのは「こういう画像でしょ」を導くとあらゆる人間の平均的な見た目の画像が生成されてくる。だれもが見覚えのある「たしかにこれは人間だ」という画像を出力してくる。そこに属性情報をつければなおのことリアルになる。「20代のスーツを着てメガネをかけた髪の長い男性」のように細かく指定すれば、それらの特徴(点)を有する画像を返す。これが生成AIの仕組みである。 | ||
| {{tag> | {{tag> | ||
outofscope/2025-02-03.1738549995.txt.gz · 最終更新: by atnmn