共有LLM基盤のリスク
Bedrockを調べていくと、結局「共有LLM基盤のリスク」に行き着く 生成AIの導入を検討するとき、最初に気になるのはたいてい次のような点だ。 入力データは学習に使われるのか モデル提供会社に渡るのか ログは残るのか 外部漏洩のリスクはどれくらいか ここまではよくある論点だ。 ただ、掘っていくと本当に重要なのはもっ...
Bedrockを調べていくと、結局「共有LLM基盤のリスク」に行き着く 生成AIの導入を検討するとき、最初に気になるのはたいてい次のような点だ。 入力データは学習に使われるのか モデル提供会社に渡るのか ログは残るのか 外部漏洩のリスクはどれくらいか ここまではよくある論点だ。 ただ、掘っていくと本当に重要なのはもっと手前にある。 そのLLMは、専用環境なのか、共有環境なのか。 今回、Amazon Bedrock を前提にかなり細かく整理していったが、最終的な論点はここに収束した。 そしてこの観点で見ると、Bedrock は「専用環境だから安全」なサービスではない。 共有マネージドサービスであり、その上で AWS が保存・学習・外部共有を止める制御をかけているサービスだ。 参考:Amazon Bedrock データ保護 - AWS ドキュメント --- 最初の論点は「学習されるか」だった 生成AIを使うとき、最初に気になるのはやはりここだ。 入力したデータが学習に使われるのか。 Amazon Bedrock について AWS は、prompts / completions は保存・ログされず、AWSモデルにも第三者モデルにも学習利用されず、第三者に配布されないと明言している。さらに FAQ では、ユーザー入力とモデル出力は model provider に共有されないと書いている。 参考:Amazon Bedrock データ保護 - AWS ドキュメント 参考:Amazon Bedrock FAQ - AWS この時点で、少なくとも Bedrock は 「入力したデータがそのままグローバル共有モデルの改善に流れるタイプのサービスではない」 と言える。 ここだけ見ると、かなり安心感がある。 --- ただ、それだけでは議論が終わらない ここで次の疑問が出てくる。 学習に使わないとしても、そもそもそのモデルはどこで動いているのか。 専用環境なのか、共有環境なのか。 この問いはかなり重要だ。 なぜなら、もし専用環境なら、物理分離そのものが安全性の土台になる。 一方、共有環境な...