ChatGPTでGPT3.5とGPT4にAtCoderの問題を解かせてみた。

はじめに

今回は、GPT3.5からGPT4のバージョンアップで性能が良くなったと言いますが、その実力を試していこうと思います。

今回解かせてみるのはこちらのA問題、D問題、G問題です。

3つの難易度の問題を用いて、性能を確かめてみたいと思います。問題の選別理由は問題文が文字だけなので、ChatGPTへの入力が簡単だったからです。

用意

まずはプロンプトを用意します。mdで書いたので、装飾がついてしまっています。分かりづらいですが、各問題をクリックすると展開されます。

A問題

以下のプログラムを、C++で実装してください。

問題文

整数A,Bが与えられるので、A+Bの値を答えてください。 但し、この問題はN択問題であり、i番の選択肢はC_iです。 正解となる選択肢の番号を出力してください。

制約

  • 入力は全て整数

  • 1<=N<=300

  • 1<=A, B<=1000

  • 1<=C_i<=2000

  • C_iは相異なる。すなわち、同じ選択肢が複数存在することはない。

  • A+B=C_iなるiが丁度 1 つ存在する。すなわち、正解となる選択肢が必ずただ1つ存在する。

入力

入力は以下の形式で標準入力から与えられる。

N A B
C_1 C_2 ... C_N

出力

答えを整数として出力せよ。

例1

入力

3 125 175
200 300 400

出力

2

例2

入力

1 1 1
2

出力

1

D問題

以下のプログラムを、C++で実装してください。

問題文

N以下の正整数のうち、a<b<cなる素数a,b,cを用いて(a^2)×b×(c^2)と表せるものはいくつありますか?

制約

Nは300<=N<=10^12を満たす整数

入力

入力は以下の形式で標準入力から与えられる。

N

出力

答えを整数として出力せよ。

例1

入力

1000

出力

3

例2

入力

1000000000000

出力

2817785

G問題

以下のプログラムを、C++で実装してください。

問題文

k以下の素数のみを素因数に持つ正整数をk-smooth numberと呼びます。 整数Nおよび100以下の素数Pが与えられるので、N以下のP-smooth numberの個数を求めてください。

制約

  • Nは1<=N<=10^16を満たす整数

  • Pは2<=P<=100を満たす素数

入力

入力は以下の形式で標準入力から与えられる。

N P

出力

答えを整数として出力せよ。

例1

入力

36 3

出力

14

例2

入力

10000000000000000 97

出力

2345134674

36以下の3-smooth numberは 1,2,3,4,6,8,9,12,16,18,24,27,32,36 の14個です。 1は任意の素数kに対してk-smooth numberであることに注意してください。

基本的には問題文そのままです。

結果

こちらがChatGPTから返ってきた結果になります。余計な文章は省いてコードだけになります。

  • GPT3.5

A問題

#include <iostream>
#include <vector>

using namespace std;

int main() {
    int n, a, b;
    cin >> n >> a >> b;
    vector<int> c(n);
    for (int i = 0; i < n; i++) {
        cin >> c[i];
    }
    for (int i = 0; i < n; i++) {
        if (a + b == c[i]) {
            cout << i + 1 << endl;
            return 0;
        }
    }
    return 0;
}

D問題

#include <iostream>
#include <vector>
using namespace std;

const int MAXN = 1000005;

int main() {
    long long N;
    cin >> N;

    // エラトステネスの篩による素数列挙
    vector<bool> is_prime(MAXN, true);
    is_prime[0] = is_prime[1] = false;
    for (int i = 2; i*i <= MAXN; i++) {
        if (is_prime[i]) {
            for (int j = i*i; j <= MAXN; j += i) {
                is_prime[j] = false;
            }
        }
    }

    vector<int> primes;
    for (int i = 2; i <= MAXN; i++) {
        if (is_prime[i]) {
            primes.push_back(i);
        }
    }

    // (a^2)×b×(c^2)と表せる数をカウント
    int ans = 0;
    for (int i = 0; i < primes.size() && primes[i] <= N; i++) {
        for (int j = i+1; j < primes.size() && primes[i]*primes[i]*primes[j]*primes[j]*primes[j] <= N; j++) {
            for (int k = j+1; k < primes.size() && primes[i]*primes[j]*primes[j]*primes[j]*primes[k]*primes[k] <= N; k++) {
                ans++;
            }
        }
    }

    cout << ans << endl;

    return 0;
}

G問題

#include <iostream>
#include <vector>
#include <unordered_map>
using namespace std;

// エラトステネスの篩による素因数分解
vector<int> prime_factorization(int x, const vector<int>& primes) {
    vector<int> factors;
    for (int p : primes) {
        while (x % p == 0) {
            factors.push_back(p);
            x /= p;
        }
        if (x == 1) break;
    }
    if (x > 1) factors.push_back(x);
    return factors;
}

// メモ化再帰による動的計画法
unordered_map<long long, long long> memo;
long long count_smooth_numbers(long long n, int p, const vector<int>& primes) {
    if (n == 0) return 1;
    if (n == 1) return 2;
    if (memo.count(n)) return memo[n];

    long long cnt = 0;
    for (int i = 0; i < primes.size(); i++) {
        if (primes[i] > p) break;
        cnt += count_smooth_numbers(n / primes[i], primes[i], primes);
    }
    memo[n] = cnt;
    return cnt;
}

int main() {
    long long n;
    int p;
    cin >> n >> p;

    // 素数リストの作成
    vector<int> primes;
    vector<bool> is_prime(p + 1, true);
    for (int i = 2; i <= p; i++) {
        if (is_prime[i]) {
            primes.push_back(i);
            for (int j = 2 * i; j <= p; j += i) {
                is_prime[j] = false;
            }
        }
    }

    // P-smooth numberの個数を数える
    cout << count_smooth_numbers(n, p, primes) << endl;

    return 0;
}

  • GPT4

A問題

#include <iostream>
#include <vector>
using namespace std;

int main() {
    int N, A, B;
    cin >> N >> A >> B;
    vector<int> C(N);
    for (int i = 0; i < N; ++i) {
        cin >> C[i];
    }

    int correct_answer = A + B;
    for (int i = 0; i < N; ++i) {
        if (C[i] == correct_answer) {
            cout << i + 1 << endl;
            break;
        }
    }

    return 0;
}

D問題

#include <iostream>
#include <vector>
#include <cmath>

using namespace std;

typedef long long ll;

// 素数判定
bool is_prime(ll n) {
    if (n <= 1) return false;
    if (n == 2) return true;
    if (n % 2 == 0) return false;

    for (ll i = 3; i <= sqrt(n); i += 2) {
        if (n % i == 0) {
            return false;
        }
    }
    return true;
}

// 素数リストの作成
vector<ll> prime_list(ll n) {
    vector<ll> primes;
    for (ll i = 2; i <= n; i++) {
        if (is_prime(i)) {
            primes.push_back(i);
        }
    }
    return primes;
}

// 問題の解答
ll count_combinations(ll n) {
    ll count = 0;
    vector<ll> primes = prime_list(sqrt(n) + 1);

    for (size_t a = 0; a < primes.size(); a++) {
        for (size_t b = a + 1; b < primes.size(); b++) {
            for (size_t c = b + 1; c < primes.size(); c++) {
                ll value = primes[a] * primes[a] * primes[b] * primes[c] * primes[c];
                if (value <= n) {
                    count++;
                } else {
                    break;
                }
            }
        }
    }
    return count;
}

int main() {
    ll n;
    cin >> n;

    cout << count_combinations(n) << endl;

    return 0;
}

G問題

#include <iostream>
#include <vector>
#include <cmath>

using namespace std;

typedef long long ll;

vector<int> generate_primes(int limit) {
    vector<bool> is_prime(limit + 1, true);
    is_prime[0] = is_prime[1] = false;

    for (int i = 2; i * i <= limit; ++i) {
        if (is_prime[i]) {
            for (int j = i * i; j <= limit; j += i) {
                is_prime[j] = false;
            }
        }
    }

    vector<int> primes;
    for (int i = 2; i <= limit; ++i) {
        if (is_prime[i]) {
            primes.push_back(i);
        }
    }

    return primes;
}

ll count_smooth_numbers(ll N, int P, int idx, ll current_product, const vector<int>& primes) {
    if (current_product > N) {
        return 0;
    }

    if (idx == primes.size() || primes[idx] > P) {
        return 1;
    }

    return count_smooth_numbers(N, P, idx + 1, current_product, primes) + count_smooth_numbers(N, P, idx, current_product * primes[idx], primes);
}

int main() {
    ll N;
    int P;
    cin >> N >> P;

    vector<int> primes = generate_primes(100);
    ll count = count_smooth_numbers(N, P, 0, 1, primes);

    cout << count << endl;

    return 0;
}

正誤

GPT3.5GPT4
A問題
D問題××
G問題×

結果は以上のようになりました。

A問題に関しては両者正解していて、コードもほぼ同じになりました。

D問題については両者エラーを吐いて不正解です。

GPT3.5のG問題はエラーこそ出ないものの、答えが違うという感じでした。 GPT4のG問題を△としているのは、入力例1の方では正解したが、入力例2の大きい数ではエラーが出てしまったためです。 本来×にすべきですが、差別化のため△にさせていただきました。

まとめ

今回は1度だけの実行で試しましが、質問毎に違う答えが返ってきます。正解する時もあれば間違っている時もあります。 そのため、質問の仕方はとても重要だと感じました。

GPT4で進化しているとはいえ、複雑だったり数学的なアルゴリズムについてはまだまだ弱そうです。 なので、まだまだ人間の代わりというのは厳しそうです。間違いも堂々と合っているかのように答えてくるので、全く知らない分野等で使うのは危険な感じはします。

とはいえ、アシスタントとしては優秀なのでどんどん使っていきたいと思います。