
今回の要点(サクッと)
漢字ドリルの成功体験そのままに英語に着手したら、データの崩壊で爆死しました。
英語は「Q&A」ではなく「ペア」で管理し、スプレッドシートの自動変換を防ぐのが鉄則です。
未来の拡張性を残した、英語データ化の「肝」をお伝えします。
目次
✅ この記事にはアフィリエイト広告(PR)が含まれます
紹介した商品・サービスをリンク経由で購入/申込いただくと、運営の励みになります。
英語ドリルをAIでAnki化:本記事の要点
- 英語ドリルをAIでデータ化する際の失敗パターン
- スプレッドシートのお節介な自動変換への対策
- 双方向学習に対応できる「ペア管理」の考え方
- 未来の拡張性を考えたデータ設計のコツ
失敗談:漢字プロンプトで英語爆死

ここだけ先読み
・漢字ドリル(第3話)がうまくいったので、意気揚々と英語に着手
・「同じプロンプトでいけるやろ」とAIに投げたら、データが崩壊
・英語は「問題・答え」ではなく「ペア」で管理するのが正解だった
前回(第3話)、Ankiの設定を「スケジュールOFF」にすることで、漢字ドリルをiPad上で完全に再現することに成功しました。
さらに私自身、働きながらiPadをフル活用して「社会福祉士」に合格した経験があり、デジタル学習には絶対の自信がありました。
「自分ならできる。漢字もいけたし、この調子で英語も全部データ化したろ!」
完全に調子に乗っていました。
「よっしゃ、この調子で英語も全部データ化したろ!」
完全に調子に乗っていました。第2話で作った「最強の漢字抽出プロンプト」がある。これを英語のテキスト(PDF)に適用すれば、一瞬で終わるはずだ、と。
結果、爆死しました。
出来上がったデータは、問題文と答えが逆になっていたり、IDが重複して上書きされたり、ひどいものでは「1-1」という単語番号が「1月1日」という日付データに勝手に変換されていました。
なぜ漢字では完璧だったAIプロンプトが、英語では役に立たなかったのか? 今回は、その失敗から導き出した「英語データ化の新・鉄則」の話です。
(脳内:あの時の全能感、返してほしいわ…)
原因:英語は双方向×シート自動変換

失敗の原因を分析すると、そもそも「漢字と英語では、ドリルとしての構造が違う」という壁にぶつかりました。
双方向学習:英→日/日→英が混在

漢字ドリルはシンプルです。「ばら(読み)」を見て「薔薇(漢字)」を答える。基本的に「1問1答」で方向が決まっています。
しかし英語は違います。
- Apple を見て りんご と答える(英→日)
- りんご を見て Apple と答える(日→英)
両方のパターンが必要なのに、漢字用の「Question(表面)」「Answer(裏面)」という箱に入れようとした結果、「あるカードは表面が英語なのに、次のカードは表面が日本語」という、学習しにくいデータが出来上がってしまいました。
スプレッドシート:ゼロ落ち・日付化

もう一つ、地味に精神を削ってくる敵がいました。Googleスプレッドシート(またはExcel)です。
AIがせっかくきれいに作ったデータを貼り付けた瞬間、スプレッドシートが余計な「気を利かせ」てデータを破壊してくるのです。
- ゼロ落ち:IDの 001 を、数値の 1 に勝手に変換する。
→ 結果:IDがズレてAnkiが別問題として認識する。 - 日付変換:1-1(レッスン1の1)を、1月1日 に変換する。
→ 結果:問題文に突然「日付」が登場する。
(心の声:勝手にカレンダーに予定入れんといてくれへんかな…)
解決①:Q&Aを捨ててA/Bペア

ここだけ先読み
・「どっちが問題か」を決めるのをやめる
・「テキストA」と「テキストB」のペアとして保存する
・データさえあれば、Anki側でどうにでもできる
試行錯誤の末、英語データは「問題・答え」という概念を捨てることにしました。代わりに採用したのが、「1行 = 1ペア」という考え方です。
英語データ設計:uidとa/b_text



AI(Gemini)への指示を、以下のように書き換えました。
- 変更前(漢字用):Question 列と Answer 列を作れ
- 変更後(英語用):a_text 列と b_text 列を作れ
例えば、「Apple(りんご)」という単語なら、どっちが問題かは決めずに、とにかく「Apple」と「りんご」をペアとして抽出させます。こうしておけば、Ankiに取り込んだ後で「A→Bのカード」も「B→Aのカード」も自由に作れるからです(Ankiには1つのデータから複数のカードを作る機能があります)。
抽出プロンプト:ペア固定+方向禁止
私が実際にGeminiに投げているプロンプトの「肝」となる部分を公開します。
【a_text / b_text の定義(固定)】
・a_text と b_text は「ペア本文」。方向(JA→EN/EN→JA等)はデータ内の a_lang/b_lang で表現する。
・direction列は出力しない(禁止)。
【Ankiで両方向カードにする前提】
・データは「1行=1ペア」のまま保持し、Anki側で同一ノートから Card1/Card2 を作って両方向にする前提とする。
・そのため、出力時に「同じ問題を2行に増やす」ことはしない(禁止)。
このように「Anki側でなんとかするから、お前(AI)はペアの抽出だけに専念しろ」と指示することで、AIの迷いがなくなり、精度が劇的に上がりました。
(脳内:指示を削ぎ落とした方が賢くなるのは、人間関係と同じやな…)
解決②:IDは英字付きで変換防止
ここだけ先読み
・スプレッドシートの勝手な変換を防ぐための物理的な対策
・IDの先頭には必ず「uid:」などの英字をつけさせる
・「重複ゼロ最優先」の指示で、修正作業をほぼゼロにする
スプレッドシートの「001→1」勝手に変換問題。これを防ぐために、AIへの指示(プロンプト)で「IDの先頭には必ず英字をつけろ」と徹底させました。
- 001 → uid: P001
- 1-1 → uid: L1-1
これならスプレッドシートも「あ、これは数字じゃなくて文字ね」と理解し、勝手な変換をしなくなります。これが地味ですが、データ作成の安定性を高める最大のコツでした。
ミニTips:重要方針
・重複ゼロ最優先:uidを安定して生成する(推測は禁止)。
この一行を入れるだけで、後の修正作業がほぼゼロになります。機械的な作業は機械に完璧にやらせる、これに尽きますね。

実戦プロンプト:安全な英語抽出テンプレ
試行錯誤の末、英語データは「問題・答え」という概念を捨てることにしました。代わりに採用したのが、「1行 = 1ペア」という考え方です。これに基づき、スプレッドシートの暴走も物理的に封じ込めたプロンプトがこちらです。
⚠️ ご利用にあたっての注意
本プロンプトは、ご自身が権利を持つ教材や、個人的な学習の範囲内(著作権法の定める私的使用のための複製など)で適切にご活用ください。著作権保護された資料を扱う際は、各教材の利用規約を遵守していただくようお願いいたします。
【公開】英語ドリル抽出プロンプト(クリックで展開)
このように「Anki側でなんとかするから、お前(AI)はペアの抽出だけに専念しろ」と指示することで、AIの迷いがなくなり、精度が劇的に上がりました。指示を削ぎ落とした方が賢くなるのは、人間関係と同じかもしれませんね。
まとめ:英語Ankiはペア設計
この章の結論
・英語は「Q&A」でなく「A/Bペア」でデータ化する
・IDに「文字」を混ぜてスプレッドシートの暴走を防ぐ
・まずは片方向ドリルとして運用開始
現在は、このデータを使って「日本語を見て英語を書く(日→英)」のドリルとして運用しています。
まだAnki側での「両方向カード生成」の設定までは手が回っていませんが、データ構造さえ「ペア」で作っておけば、将来的に「英→日」のリスニング用カードを作るのも一瞬です。
「未来の拡張性」を残しつつ、まずは目の前のテスト対策を乗り切る。これで漢字と英語、高校受験における2大暗記科目の「環境」は整いました。あとは、本人がやるかどうか(ここが一番難しいのですが…)。
次回は、ここまでの「漢字」「英語」のデータ化を経て、実際に息子がどう変わったか、そして「親が環境を用意すること」の本当の意味について、少し振り返ってみたいと思います。
※料金や所要時間は訪問時点・わが家の体験に基づく目安です。最新情報は公式サイト等でご確認ください。
Q&Aまとめ
Q. AIへのプロンプトで一番重要な点は?
A. 「役割を限定する」ことです。英語の場合なら、問題の方向性まで判断させるのではなく、まずは正確な「ペア抽出」だけに専念させることで精度が安定します。
Q. ID(uid)を付けるのはなぜ必要?
A. Ankiがカードを識別するためです。IDがあれば、後からデータを修正して再取り込みした際に、学習進捗を維持したまま上書き更新ができます。
📣 旅路々(tabiji days)への応援について(※広告リンクを含みます)
最後まで読んでいただきありがとうございます。
「まあちょっとだけ応援してやるか」という奇特な方は、普段のお買い物を下のボタンから始めていただけると助かります。
※ここから入って何を買ってもらっても、私の応援になります(小声)
English quick summary (for overseas readers)
English title: How to digitize English flashcards using AI without data corruption.
Following the success of the Kanji drill, I tried digitizing English text using the same AI prompt. However, it failed miserably because English requires two-way learning (EN-JP and JP-EN).
The data became messy, and Google Sheets' auto-conversion feature ruined the IDs.
The solution is to manage data as "pairs" rather than "Questions and Answers."
By using "a_text" and "b_text" columns, you can generate both directions of cards later in Anki.
This keeps the data structure clean and highly flexible for future needs.
Another tip is to add "uid:" prefix to IDs to prevent auto-conversion in spreadsheets.
Preventing "001" from becoming "1" is crucial for stable data management.
This small adjustment saves a lot of manual correction time later.
Now, the digital environment for both Kanji and English is ready for my son's exams.
The key is to let the AI focus on extraction and handle the logic within Anki.
Next, I'll reflect on how these tools actually changed my son's learning habits.