title-praivacy
2025/02/12

DeepSeekは東大英語・数学を解けるのか

中国発の高性能生成AI(DeepSeek)は、東大の入試を解けるのか?

 

2025年、人工知能の世界に大きな波紋を投げかけているのが、中国発の生成AI「DeepSeek」です。超高性能でありながら驚くほどリーズナブルな価格設定により、その登場はアメリカの株式市場にも大きな影響を与えました。当塾では、この新しいAIの実力を探るべく、2024年の東大入試の英語・数学の問題に挑戦させてみました。その結果をご報告いたします。

 

DeepSeek

 

東大の英文要約問題の挑戦

 

まず、2024年東大入試英語の第1問(要約問題)に挑戦させました。これは当塾のブログでも以前に他の生成AIで検証を行った問題です。結論的を先に述べましょう。DeepSeekは英文の本質を理解し、的確に要約する能力については非常に優れた性能を示しましたしかしながら、入試問題に答えるとなると、重要な問題を孕んでいました。要するに、他の生成AI同様に、指定された字数の制限内で要約文を作成出来ないのです。また自身が作成した文章の文字数を正確にカウントすることさえ出来ないのです。

 

 

 

具体的に見てみましょう。問題は以前取り上げた2024年の大問1ですが、再掲します。

 

以下の英文を読み、 その内容を70~80字の日本語で要約せよ。 句読点も 字数に含める。

 

 There is no doubt that one of the major issues of contemporary U.S. history is corporate propaganda. It extends over the commercial media, but includes the whole range of systems that reach the public: the entertainment industry, television, a good bit of what appears in schools, a lot of what appears in the newspapers, and so on. A huge amount of that comes straight out of the public relations industry, which was established in this country and developed mainly from the 1920s on. It is now spreading over the rest of the world.

 

  Its goal from the very beginning, perfectly openly and consciously, was to “control the public mind,” as they put it. The public mind was seen as the greatest threat to corporations. As it is a very free country, it is hard to call upon state violence to crush people’s efforts to achieve freedom, rights, and justice. Therefore it was recognized early on that it is going to be necessary to control people’s minds. All sorts of mechanisms of control are going to have to be devised which will replace the efficient use of force and violence. That use was available to a much greater extent early on, and has been, fortunately, declining—although not uniformly—through the years.

 

  The leading figure of the public relations industry is a highly regarded liberal, Edward Bernays. He wrote the standard manual of the public relations industry back in the 1920s, which is very much worth reading. I’m not talking about the right wing here. This is way over at the left-liberal end of American politics. His book is called Propaganda.

 

  Bernays’s Propaganda opens by pointing out that the conscious manipulation of the organized habits and opinions of the masses is the central feature of a democratic society. He said: we have the means to carry this out, and we must do this. First of all, it’s the essential feature of democracy. But also (as a footnote) it’s the way to maintain power structures, and authority structures, and wealth, and so on, roughly the way it is.

 

  I should mention that terminology changed during the Second World War. Prior to World War II, the term propaganda was used, quite openly and freely. Its image got pretty bad during the war because of Hitler, so the term was dropped. Now there are other terms used. (東京大学、2024年1️⃣)

 

 

 

DeesSeekの答(その1)

 

現代アメリカ史の主要問題は企業プロパガンダである。1920年代に発展したPR産業はメディアや教育を通じ、大衆の心理を制御し権力構造を維持する。バーネイズは民主主義に不可欠と主張したが、第二次大戦後は「プロパガンダ」の用語が避けられた。80)  (注意⇐句読点を含めて117字の間違いです)

 

英文の要約としては悪くはないのですが、字数は80字ではなく113文字です。設問には70-80字で書けという条件がついているのですから、答案としては致命的です。

 

 

そこで字数を減らすように、次のようにお願いしてみました。「数えてみましたが、117字あります。もう少し減らしてください」。するとDeepSeekは13秒間考えて要約文を修正すると、DeesSeekは次(写真画像)のように思考した挙げ句、要約文を書き直してくれました。(下の画像は、私の命令とDeepSeekの思考過程です)。

 

IMG_7525

 

DeesSeekの答(その2)

 

現代アメリカ史の主要課題は企業プロパガンダだ。1920年代発展のPR産業はメディア等を通じ大衆心理を操作し企業支配を維持。バーネイズは民主主義の要と主張したが、第二次大戦後、用語が変更された。79字)(注 ⇐またしても文字数の数え間違いです。96字です)

 

 

しかし、またしても字数オーバーでした。DeepSeekは(79字)だと自称しているのですが、実際は96字なのです。これでは駄目ですね。どうやら現段階の生成AIは、DeepSeekだろうとChatGPTだろうと、字数を数えられないようです。そこで、「本当に79字ですか。数え直してみてください」と命令しました。すると、11秒間の思考を経て、次のような返答をしてきました。下の画像を見てください。DeepSeekの思考と解答が出ています。

 

IMG_7527

 

DeepSeekは(75字)と自称する要約文を書いてきたわけです。そして、字数確認のプロセスまで提示してくれました。しかし非常に変です!要約文は全部で5行あるのに、1~3行までしかカウントしていないのです。こんなに頭の良いDeepSeekなのですが、どうやら字数は数えられないのです。ただし念の為に重ね重ね付け加えておけば、なにもDeepSeekだけの弱点ではアリません。他のどんな生成AIも、2025年2月段階では、自分が書いた文の文字数は数えられないようなのです。

 

 

そして、さらなる問答をDeepSeekと繰り返しましたが、結局、字数を設問の条件に整えることは出来ませんでした。要するに、DeepSeekは要約文の作成能力はあるが、適切な字数で書くことは不可能なのでした。

 

 

英文法的な読解と説明の能力の検証

 

東大入試問題ではありませんが、前回取り上げた英文(What does it matter how old I am?) の解釈と文法的説明について、DeepSeekにも挑戦させてみました。これも結論を最初に書いておきましょう。残念ながら、この分野においてもDeepSeekはまともな解答を提供できませんでした。文法規則の説明というのは、現状の生成AI全般に共通する課題のようです

 

では、具体的にDeepSeekの実力を見ていきましょう。

 

 

私の質問

 

What does it matter [how old I am]?what は目的語ですか?

 

 

 

DeepSeekの答

 

What does it matter [how old I am]?」という文において、「what」は目的語ではありません。この文の構造を詳しく見てみましょう。

 

1. **What」の役割**: この文では「what」は疑問詞として使われており、文の主語になっています。「What」は「何が」という意味で、文の主題を尋ねています。

2. **does it matter」の部分**: ここでit」は形式主語であり、真の主語は後ろに来る「how old I am」という節です。「matter」は「重要である」という意味の動詞です。

3. **how old I am」の部分**: この節は「it」の具体的な内容を示しており、「私が何歳か」という情報を提供しています。

したがって、この文の構造は次のようになります

 

この文の構造は次のようになります:

 

**What**(主語) + **does**(助動詞) + **it**(形式主語) + **matter**(動詞) + **[how old I am]**(真の主語)

 

つまり、「What does it matter [how old I am]?」は、「私が何歳かということが、何の問題になるのか?」という意味です。ここで「what」は主語であり、目的語ではありません。

 

もし「what」が目的語であれば、文の構造が異なります。例えば、「What did you say?」という文では、「what」は「say」の目的語として機能しています。

 

まとめると、この文では「what」は主語であり、目的語ではありません

 

 

 

What does it matter [how old I am]?の”What”は副詞であり、修飾語にすぎないのですが(⇐これが正解です)、DeepSeekは「Whatは主語であり」と解答してきのです。そこで、私は次のような質問をしてみました。

 

 

私の質問

 

 

仮主語があり、真の主語があり、さらに主語があるのですか。 

 

 

DeepSeekの返答

 

 

いい質問です!確かに、この文の構造は少し複雑に感じられるかもしれませんが、順を追って整理していきましょう。

 

### 文の構造

 

What does it matter [how old I am]?」という文では、以下の要素が含まれています:

1. **What**: この文の主語です。「何が」という意味で、文の主題を尋ねています。

2. **does it matter**: ここで「it」は**形式主語**(仮主語)です。真の主語は後ろに来る「how old I am」という節です。

3. **how old I am**: この節は**真の主語**であり、「it」が指す具体的な内容です。

 

つまり、この文では「what」が文全体の主語であり、「it」は形式主語として機能し、その真の主語が「how old I am」という節です。

 

 

### 主語が複数あるように見える理由

– **what**: 文全体の主語として機能し、「何が」という疑問を表します。

– **it**: 形式主語として、文の構造を整えるために一時的に主語の役割を果たします。

– **how old I am**: 真の主語として、「it」が指す具体的な内容を表します。

 

このように、文の構造上、主語が複数あるように見えるのは、形式主語と真の主語が共存しているためです。

 

### 例文で確認

– **形式主語「it」と真の主語「how old I am**:

It matters how old I am.」(私が何歳かは重要です。)

ここで「it」は形式主語で、「how old I am」が真の主語です。

 

– **疑問文にした場合**:

What does it matter [how old I am]?」(私が何歳かが何の問題になるのか?)

この文では「what」が主語であり、「it」は形式主語、「how old I am」は真の主語です。

 

このように、形式主語と真の主語が共存する文では、主語が複数あるように見えることがありますが、それぞれの役割を理解することで文の構造が明確になります。

 

以上のように、DeepSeekは自信満々に頓珍漢な解答(=形式主語、真主語、主語と主語が3つ有る)を返してきたという訳です。日本語訳ならば、ある程度以上には正確な訳文を作れるのですが、英文の文法的理解となると、ちょっと厳しいようです。

 

 

 [参考資料]

以下は上記のDeepSeekとのやり取りを、スクリーンショットしたものです。

 

IMG_7376

 

IMG_7377

IMG_7378

IMG_7379

 

 

 

東大文系数学への挑戦

 

2024年東大文系数学の大問1についても、DeepSeekに解かせてみました。これもまた結論を先取りしておきましょう。

 

 

 

  • 大問1(1)(2)については、正解を導き出すことができました。しかも、他の生成AIと比較して、解答速度が格段に速いという特徴が見られました。
  • 証明問題{今回の問題で言えば、問1(3)}については、他の生成AI同様、苦手なようです
  • 関数のグラフ化については、指示があれば適切に対応できます。
  • 思考過程の説明は非常に丁寧です。ただし、まず中国語で思考過程を示しその後日本語に翻訳したりすることが多く、この点は改善の余地があるかもしれません。
  • 総じて見れば、使い勝手は他の生成AI(ChatGPTなど)と比べて少々悪い。この点は改善の余地がある。

 

 

では、具体的に問題を見ていきましょう。

 

utm1

 

 

数2の問題ですが、典型的な問題で比較的解きやすいものと思われます。まずは(1)の問題の答えからみていきましょう。

 

ut1-1ans

 

 

模範的な解答例でしょう。数式だけでなく、しっかりと文章で説明してくれるのも、評価しておきたいですね。ただし、x^2+y^2=1を微分してdy/dx=-x/y を導き、点Pの微分係数は-cosθ/sinθであると述べていますが、これは数3の微分の方法です。普通ならば、別の方法を使うことが期待されているはずです。(⇐昔と変わっていなければ、東大の文系数学は数2までのはずです)。しかし、これはDeepSeekに非があるわけではありません。

 

 

ついで、DeepSeekの(2)の解答を見てみます。

 

ut1-2ans

 

これも、模範解答と言ってよいでしょう。
さて問題は(3)の解答です。残念ながら、これはちょっと不味かったです。
IMG_2465
まず最初、A≧√3 を証明しなければならないのに、証明すべき不等式を前提に、その計算を展開しているところです。正しい証明の記述の仕方を学ぶ必要がありますね。しかし本当に問題だったのはその後で、次のような答案を書いています。「ある不等式が, 0<s<1で成り立つことを確認します。例えば、s=1/2のときに、不等式は成り立ちます。したがって、 0<s<1 のときに不等式は成り立ちます」という趣旨の文章を書いているのです。
例えば、s=1/2 のとき、7.81>=6.75となり、不等式が成り立ちます。同様に、他のsの値でも成り立つことが確認できます。したがって、A>=√3が示されます。(⇐DeepSeekの誤った推論)
DeepSeekの名誉のために申し上げれば、他の生成AIも証明問題は苦手であること、また別の機会に、再度DeepSeekに対して同じ不等式の証明を命じたところ、正解と思われる方法で答えることが出来ました。(以下の画像を参照のこと)
step1-2
step3
step3
step4-6

最期に

 

今回は、デビューしてホヤホヤの中華式生成AI(DeepSeek)に、東京大学の2024年の英語・数学を解いてもらいました。東大の問題に正解を答えるという意味では、まだまだ完璧だとは言い難かったかもしれません。2025年の段階では、人間が微調整しないと不可能な要素があるようなのです。

 

 

しかし、生成AIの力を侮ってはいけません。生成AIの欠点を見るばかりでなく、むしろ良い側面を活用することを考えていきましょう。そうすれば、英語力、とくにスピーキングとライティングの力は、今までとは比べ物にならないくらい、超飛躍的に向上するはずなのです。次回は出来たら、生成AIの賢い使い方について、紹介していきましょう。

◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇
シリウス英語個別指導塾 by 東大式個別ゼミ
中高一貫校専門 大学受験英語塾 英検/TEAP
相模大野・中央林間・横浜・藤沢・町田
住所:神奈川県相模原市南区東林間4丁目13-3
TEL:042-749-2404
https://todaishiki-english.com/
◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇
2025/01/19

生成AIに英文法の質問をするな。ただしPerplexityは少し使える。

生成AI(ChatGPT, Claude, Geminiなど)に英文法に関する問題を質問した人は、すでにたくさんいると思います。しかし生成AIというのは、英文法だろうと文語文法(古典語の文法)だろうと、文法に関して言えば、出鱈目な解説をやらかします。だから初学者の場合、英文法の家庭教師の代わりに生成AI(ChatGPT, Claude, Geminiなど)を使ってはいけません。

 

 

実際、ある東大生はフランス語文法についてChatGPTに質問をし、その回答を鵜呑みにしたために、酷い目にあってしまいました。「生成AI(ChatGPT, Claude, Geminiなど)に英文法の質問をするな」が大原則なのです。

 

 

しかし、使い方によっては、ある生成AIだけは役に立つ場合もあるようです。今回は、そのやり方について解説しようと思います。

 

 

 

例えば、次の英文の解読に苦労しているとしましょう。

 

 

 

What does it  matter [how old I am]?

  ?        主語 動詞         ?

 

 

この文章では、itが主語でmatterが動詞だということは容易に理解できます。しかし、What と how old I am の役割や品詞となると、戸惑う人も多いでしょう。とくにやっかいなのは、先頭にあるWhatです。

 

 

常識的に考えると、whatは疑問代名詞または関係代名詞でしょう。それならば、目的語(O)なのか、補語(C)なのか、あるいは真主語(S)なのか、分からないという訳です。しかし、動詞のmatter は、日本の英和辞典では自動詞なので、whatを目的語にする訳にはいかない。かといって主語や補語だというのも奇妙すぎます。真主語が先頭にくるのは不自然ですし、matter は補語を取る動詞のとは考えにくい。

 

 

こんな時に生成AIに質問するとどうなるのか?。結論的に言えば、英文法について、ほとんどの生成AIはデタラメな回答をしてきます。全く使い物になりません

 

 

具体的に言えば、Chat GPT、Claude、Geminiなどの主だった生成AIは、いずれもデタラメ回答をよこしてきます。「Whatは目的語です」「Whatは関係代名詞です」「Whatは主語です」等々と、間違った回答を自信満々で返してきます。(ここでは、その例を挙げません。よろしければ、読者の皆様が質問してみてください)。

 

 

では、生成AIはどれも全く役に立たないのかというと、そうではありません。現状(2025年1月)では、いくつかの生成AIのうちPerplexity(パープレキシティ、パープレ) だけは、使い方さえ間違いなければちょっと頼りになります

 

perplexity

 

 

Perplexityの特徴は、回答の根拠となる情報のオンライン・アドレスを提示してくれることにあります。(ただし、根拠を提示しない場合もあるので注意してください)。だから、情報元のオンライン文献を読んで、我々は判断出来るのです。その情報源またはその内容が信頼・信用できそうであれば、Perplexityの回答は大いに参考すれば良いのです。

 

 

もっともGoogleを使っても、ある程度は検索可能な情報が多いですが、Perplexityを使えば、Google検索よりも遥かに迅速に、適当な文献に巡り合うことが出来るのです。具体例を提示しましょう。Perplexityへの私の質問とその回答の画像を貼っておきますから、見てください。

 

 

 

perの正答

 

 

 

 

 

画像をテキスト化すると、以下のようになります。

 

<<Question > >

what does it matter how old I am ? のwhat の役割と意味を教えてください。これは主語ですか?目的語ですか?それとも補語ですか?あるいは形容詞副詞のような修飾語ですか?

 

 

<<Perplexityの答 > >

「What does it matter how old I am?」における「what」の役割は、副詞です。

 

この文では、「what」が動詞「matter」を修飾し、「どれほど」「どの程度」という意味で使われています。つまり、「それがどれほど重要なのか」というニュアンスを表しています。「matter」は自動詞であり、「what」は目的語ではなく、動詞の程度を問う副詞的な働きをしています。

 

 

正解は以下のようにまとめる事もできるでしょう。(it=仮主語、 how old I am=真主語は私が補いました)

 

 

 

What  does    it     matter    how old I am

副詞    仮主 自動詞  真主語(名詞節)

 

 

 

日本語訳としては、「私が何歳だろうと、そんなことはどうでも良いことだ」となるでしょう。

 

 

 

 

さてここでポイントとなるなのは、Perplexityが、(1)そもそも情報源を提示しているか、(2)その情報源とその内容が信頼のおけるものか、です。今回は幸いにも情報源が提示されています。そこで、(2)情報源とその内容のチェックをします。

 

 

 

 

一つの情報源は、English Language & Usage  でした。私は利用したり参照したりしたことはないのですが、非常に信用できるサイトに思われました。そしてその中の“Ask Question” が引用され、What does it matter のwhatは代名詞ではなく、副詞であると説明されております。(写真を参照してのこと)

 

 

IMG_7171

 

 

 

もう一つはWordReference Forums と言うサイトでした。私は本サイトについても詳しく知りませんでしたが、英語の文法や語法についてサイトがまがい物であるとは考えられません。このサイトの答えは大いに参考になると考えて良いでしょう

 

 

IMG_7172

 

IMG_7174

 

 

 

上の画像を見てください。

 

 

Fort Lee さんという韓国人の英語学習者が、”What does it matter”について質問を投げかけ、これに対して英語ネイティヴのイギリス・ロンドンのHermione Golightlyさんという方ーーおそらくは高齢者ヴォランティアのネィティヴ先生ーーが、回答をしています。ここでのやり取りも大変参考になります。

 

 
ところで、こんなふうに情報源のチェックをするのであれば、わざわざPerplexityなんかを使わずに、いくつかの英文法関連のフォーラムで調べたり、Google検索で調べてみたら良いではないか、という意見も出てきそうです。たしかにそういう考え方も一理あります。しかし、Googleで調べても、適当なサイトを探し当てるのは結構時間がかかります。

 

試しにGoogle先生に質問をしてみましょう。「What does it matterのwhatの文法的説明」と入れてみました。すると出てくるのは、次のような画面です。

 

 

IMG_2399

 

IMG_2400
今回は、比較的早い段階で、Yahoo知恵袋で正解が出てきました。しかし、このサイトはちょっと信頼しにくいのが欠点です。また、英語専門とみられるサイトも沢山出てきましたが、いずれもwhatの正体については情報をあたえてくれるものではありませんでした。

 

 

 

 

 

また、WordReference Forums等の英語関係のサイトを巡回してチェックすれば良いではないか、という意見もありそうですね。これも正論です。しかし結論を先取りすれば、「Perplexityで検索するほうが、手っ取り早い」です。

 

 

実は私も、WordReference Forumsで”what does it matter” とタイプして検索したのです。すると、what does it matter の ”what”とは何物かと質問する非英語国の学習者がかなり多いのです。

 

例えば、あるロシア人学習者は、whatの正体は一体何なのだと執拗に質問するのですが、英語ネイティヴの先生たちは、非ネイティヴの疑問をあまり理解できないようです。要するに、「(あんまり気にするなよ。)そんな風に表現するのだよ」みたいな、非常に残念な回答で済まそうとします。

 

 

実際、英米の英英辞典でも、そういう説明をするのが普通です。たとえば、ロングマンの英英辞典を引けば、

 

 

what does it matter? =spoken used to say that something is not important

 

という意味の説明があるだけです。whatの文法的側面についての説明は一切ありません。(ただしitが仮主語であるという説明についてならば、Oxford Advanced Learner’s Dictionaryなどには掲載されています)。

 

 

何を言いたいかというと、「what does it matter の what は副詞で、howみたいな意味なんだよ」というピンポイントに沿う説明に出会うのは、決して容易ではないのだということです。

 

 

そんなわけですから、英文法の疑問を持つとき、Perplexityに疑問を投げかけるのは、それなりに有効だとの結論を再度訴えておきます

 

 

 

しかし、大いに注意が必要です。Perplexityならば、英文法のことについて、いつでも確かな情報を提供してもらえるかもしれないと、甘い考えを持っては絶対にいけません。

 

 

先ほどは、What does it matter how old I am? のwhatの役割や品質についてPerplexityに問い、的確な情報と答えを返してもらいました。そこで今度は、ちょっと文章を変え、What does it matter if it is rainy today? について同じ質問をしてみました。”how old I am”を” if it is rainy today”に変えてみたのです。すると、今度は情報源を一切提示せず、次のようなデタラメ回答をしてきたのです。

 

 

IMG_7176

 

 

画像をテキスト化すると、

 

私の質問

what does it matter if it is rainy today ? のwhat の役割と意味を教えてください。これは主語ですか?目的語ですか?それとも補語ですか?あるいは形容詞副詞のような修飾語ですか?

 

 

 

Perplexityの答

 

「What does it matter if it is rainy today?」における **what** の役割は、**目的語** です。(←誤答です。念のため)。

 

### 分析

この文を分解すると次のようになります:

 

  1. 主節:「What does it matter」

   – 「matter」は自動詞として「重要である」という意味を持ちますが、この場合、「what」がその内容を尋ねる疑問詞として使われています。

   – 「what」は「何が」「どれほど」といった意味で、「何が重要なのか」を問う役割を果たしています。

   – ここで「what」は動詞「matter」の目的語です。

 

  1. 従属節:「if it is rainy today」

   – この部分は「if節」として、主節の文全体に補足情報を加えています。「今日雨であることが、何の重要性があるのか?」という意味になります。

### 結論

この文では「what」は動詞「matter」の**目的語**として機能し、「何が(どれほど)重要なのか」という疑問を表しています。(←もちろん誤答です

 

 

 

Perplexityの誤答を図式化すると以下のようになります。

 

What  does  it     matter  if it is rainy today?

目的語    主語 動詞  従属節(もし・・ならば)

誤答です。

 

 

 

なお正解は以下の通りです。

 

What does it    matter [if it is rainy today]?

副詞  仮主 自動詞 真主語(=名詞節、SVかどうか)

 

 

(日本語訳)「今日が雨模様だとして、それがどうしたというのだ」

 

 

 

どうでしょうか。情報源を提示しないとき、Perplexityは信用してはいけないのです

 

 

ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー

最後に

 

 

生成AI(ChatGPT, Claude, Geminiなど)は英文法的な質問をしてもその回答は信頼できないこと、しかし生成AIのPerplexityを使えば、有益な情報を迅速に入手できる場合があるということが、今回のブログで伝わりましたでしょうか。

 

 

 

なお、今回の英文What does it matter ? に関して言えば、今回一番頼りになったのは、おそらく日本の辞書、つまり英和辞典でした。下の画像は、『ライトハウス英和辞典』で、whatを調べたものです。(英英辞典は、Oxford, Cobuild, Collins, Longmanにあたってみましたが、あまり参考にはなりませんでした)。

 

IMG_7252

 

 

 

◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇
シリウス英語個別指導塾 by 東大式個別ゼミ
中高一貫校専門 大学受験英語塾 英検/TEAP
相模大野・中央林間・横浜・藤沢・町田
住所:神奈川県相模原市南区東林間4丁目13-3
TEL:042-749-2404
https://todaishiki-english.com/
◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇
 
お問い合わせ