コード生成AI、AlphaСode

人工知能分野の開発で知られるDeepMind そして人間レベルでコンピュータゲームやボードゲームをプレイできるニューラルネットワークを構築していることが最近明らかになった アルファコードプロジェクト どのように説明されていますか コード生成のための機械学習システム Codeforces プラットフォーム上のプログラミング コンテストに参加し、平均的な成績を示すことができる人。

プロジェクトについて言及されています 「Transformer」ニューラルネットワークアーキテクチャを使用 他のサンプリングおよびフィルタリング方法と組み合わせて、自然言語テキストに対応するさまざまな予測不可能なコード バリアントを生成します。

仕組み・仕組み アルファコード これはフィルタリング、グループ化、分類に基づいており、生成されたオプションのフローから最適な動作コードを選択し、正しい結果が得られることを確認するために検証されます (コンテストの各タスクでは、一例が示されています)。入力データと対応する結果) をこの例に示します。これはプログラムの実行後に取得する必要があります)。

AlphaCode について詳しく説明します。AlphaCode は、トランスフォーマー ベースの言語モデルを使用して前例のない規模でコードを生成し、その後、有望なプログラムの少数のセットに巧みにフィルターをかけます。

私たちは、Codeforces で開催されるコンテストを使用してパフォーマンスを検証します。Codeforces は、コーディング スキルをテストするために世界中から数万人の参加者を集める定期的なコンテストを主催する人気のプラットフォームです。 評価のために、トレーニング データよりも新しい 10 個の最近のコンテストを選択しました。 AlphaCode は平均的な競合他社とほぼ同じレベルに位置し、AI コード生成システムがプログラミング コンテストで競争力のあるレベルのパフォーマンスを達成したのは初めてです。

ラフなシステムトレーニングに 機械学習、 パブリック GitHub リポジトリで利用可能なコード ベースが使用されたことが強調表示されます。。 初期モデルを準備した後、Codeforces、CodeChef、HackerEarth、AtCoder、Aizu コンテストの参加者に提供されたサンプル問題とソリューションを含むコード コレクションに基づいて最適化フェーズが実行されました。

合計すると、AlphaCodeの形成のために 715 GB の GitHub コードが使用されました 競合他社の典型的な問題に対する解決策の例が XNUMX 万件以上あります。 コード生成に進む前に、タスクのテキストは正規化フェーズを経て、余分なものがすべて除外され、重要な部分のみが残りました。

システムをテストするために、10 人以上の参加者が参加する 5.000 の新しい Codeforces コンテストが選択され、機械学習モデルのトレーニングが完了した後に開催されました。

AlphaCode の結果は私の期待を上回っていたと言っても過言ではありません。 単純な競争問題であっても、多くの場合、アルゴリズムを実装するだけでなく、アルゴリズムを発明することも要求されるため (これが最も難しい部分です)、私は懐疑的でした。 AlphaCode は、有望な新規参入者と同等のパフォーマンスを発揮することができました。 これから何が起こるのか楽しみです!

マイク・ミルザヤノフ

コードフォースの創設者

許可された割り当ての結果 AlphaCode システムが入力するための これらの能力の資格の約半分 (54,3%)。 AlphaCode の全体的な予測スコアは 1238 ポイントで、過去 28 か月間に少なくとも 6 回コンテストに参加したすべての Codeforces 参加者の中で上位 XNUMX% に入ることが保証されています。

このプロジェクトはまだ開発の初期段階にあり、将来的には、コードの作成を支援するシステムやアプリケーションに向けて、生成されたコードの品質を向上させ、AlphaСode を開発することが計画されていることに注意してください。プログラミングスキルのない人でも利用できる開発ツール。

最後に あなたがそれについてもっと知りたいなら重要な開発機能は、英語の問題ステートメントを含む入力テキストを入力として、Python または C++ でコードを生成する機能であることを知っておく必要があります。

詳細を確認できます 次のリンクで。


コメントを残す

あなたのメールアドレスが公開されることはありません。 必須フィールドには付いています *

*

*

  1. データの責任者:MiguelÁngelGatón
  2. データの目的:SPAMの制御、コメント管理。
  3. 正当化:あなたの同意
  4. データの伝達:法的義務がある場合を除き、データが第三者に伝達されることはありません。
  5. データストレージ:Occentus Networks(EU)がホストするデータベース
  6. 権利:いつでも情報を制限、回復、削除できます。