はじめに
"Vocabulary Book by DeepSeek "は、DeepSeekのビッグモデルに基づいて開発されたオープンソースプロジェクトで、英語学習者が大学英語レベル4(CET-4)の語彙を効率的に習得することを目的としています。このプロジェクトはGitHubでホストされており、開発者のvxiaozhiによって作成されました。PythonスクリプトとDeepSeekの強力な言語生成機能を組み合わせることで、単語の意味、語源、例文、暗記テクニックを含む語彙学習教材を自動的に生成します。このツールは、単語をアルファベット順に整理し、明確な出力形式を持ち、JSONファイルの保存をサポートし、学生、教師、自己学習者に適しています。プロジェクトコードは公開されており、80%以上がDeepSeekによって自動生成され、教育におけるAIの革新的な応用を反映しています。4級対策でも語彙力アップでも、このツールは便利な学習サポートを提供します。
機能一覧
- 4級語彙学習教材の自動生成DeepSeekインターフェイスを呼び出し、単語の意味、語根解析、例文、記憶のヒントを生成します。
- アルファベット順ストレージCET-4単語を頭文字AからZまでのJSONファイルに分割。
- 役立つ画像生成記憶力を高めるために、スクリプトを使って単語に関連したニーモニック・イメージを生成する。
- 記事ジェネレーター文字で始まるMarkdown形式で単語学習記事を生成。ブログやノート整理に最適。
- オープンソース・サポート完全なPythonコードが提供され、ユーザーは自由に機能を変更または拡張することができます。
ヘルプの使用
設置プロセス
「Vocabulary Book by DeepSeek」はPythonベースのツールで、実行には一定のプログラミング環境が必要です。以下、詳しいインストール手順と使用方法を説明します:
1.環境準備
- PythonのインストールPython 3.8以上がシステムにインストールされていることを確認してください。Python 3.8はPythonのウェブサイトからダウンロードしてインストールできます。
- クローンプロジェクトターミナルまたはコマンドラインを開き、以下のコマンドを入力してプロジェクトをローカルにダウンロードします:
git clone https://github.com/vxiaozhi/vocabulary-book-by-deepseek.git cd vocabulary-book-by-deepseek
- 依存関係のインストールプロジェクトはいくつかのPythonライブラリに依存しているので、以下のコマンドを実行してインストールしてください:
pip install -r requirements.txt
そうでなければ
requirements.txt
コア・ライブラリは手動でインストールできる:pip install requests openai pillow
- DeepSeek API の構成DeepSeek API キーが必要です。DeepSeek アカウントにサインアップした後、DeepSeek プラットフォームでキーを取得し、プロジェクト構成ファイルまたはコードの API 呼び出しセクションに入力します。
2.主要機能の使用
このプロジェクトは、単語ヘルパーツールとヘルパー画像生成ツールの2つのコアスクリプトで構成されています。以下に詳細な動作フローを示す:
(1) 単語学習教材の作成
- ワードデータを準備するプロジェクトはデフォルトで提供される
data/cet4/
ディレクトリ内のアルファベットA〜ZでソートされたJSONファイル(例えばA.json
そしてB.json
).各ファイルには、対応する文字で始まる単語のリストが含まれている。 - スクリプトの実行::
- ターミナルを開き、プロジェクトのディレクトリに移動する。
- 以下のコマンドを実行し、単語解析を行う:
python cet4_word_helper.py
- スクリプトは
data/cet4/
リストの単語は、DeepSeek API を介して、単語の意味、語根、例文、および記憶のヒントを生成するために使用されます。result/cet4/
ディレクトリ内のJSONファイル(例えばA.json
).
- 結果を見る生成されるJSONファイルの構造例:
{ "word": "abandon", "meaning": "放弃", "root": "a-(加强) + bandon(控制)", "example": "He had to abandon his car in the snow.", "memory_tip": "想象一个人在雪地里放弃aband控制on车。" }
(2) ニモニック・ピクチャーの生成
- 画像生成スクリプトの実行::
- 以下のコマンドを実行する:
python gen_words_img.py
- スクリプトは
result/cet4/
スクリプト内の単語データはニーモニック画像の生成に使用され、デフォルトでは指定されたディレクトリに保存されます(スクリプト内で出力パスを設定する必要があります)。
- 以下のコマンドを実行する:
- カスタマイズされた設定修正
gen_words_img.py
画像サイズ、解像度、スタイルなどのパラメータを設定し、要件を満たす画像が生成されるようにします。
(3) 語彙記事の作成
- 記事生成スクリプトの実行::
- 実施する:
python gen_articles.py
- スクリプト・リーディング
result/cet4/
のような)26のMarkdownファイルを生成する。2025-02-11-cet4-A.md
) に保存する。result/cet4_articles/
カタログ
- 実施する:
- 出力フォーマット各ファイルには、学習や共有に適した、文字で始まる単語の分析が含まれています。例
--- title: "四级词汇-A开头单词" date: 2025-02-11 --- ## abandon 词义:放弃 词根:a-(加强) + bandon(控制) 例句:He had to abandon his car in the snow. 记忆技巧:想象一个人在雪地里放弃aband控制on车。
3.運営上の考慮事項
- APIキーのセキュリティDeepSeek API キーはスクリプトに直接ハードコードしないでください:
export DEEPSEEK_API_KEY='你的密钥'
- ネットワーク接続このスクリプトは DeepSeek API に依存しているため、実行時にネットワークが空いていることを確認してください。
- ファイルパスのチェックもし
data/cet4/
もしかしたらresult/cet4/
ディレクトリが見つからない場合は、手動でスクリプトパスの設定を作成または調整する必要があります。 - 拡張機能例えば、レベル6のワード・サポートを追加したり、出力フォーマットを調整したりといった具合だ。
4.特別な機能の操作
- バッチファイルメインスクリプトを一度だけ実行することで、すべての文字の単語プロファイルを一度に生成します。
- ピクチャー・アシスト・メモリー生成された補助画像は、電子ノートに取り込んだり、テキストベースの学習に添えて印刷することができます。
- 記事の共有Markdownファイルは、ブログ投稿に直接使用したり、Notionなどのツールにインポートして学習ノートを整理したりすることができる。
クライン・ミッション・キュー
タスク1
用 Python 写一个 cet4 单词助记工具,对单词进行词义词根分析、例举例句、并提供一些高效的记忆技巧和窍门。 详细需求如下:
1. 单词已经按照字母归类存储在data/cet4/目录下,分别为: A.json B.json ... Z.json
2. 读取每一个 data/cet4/目录下 每个JSON文件中的所有单词,对每个单词调用OpenAI的接口生成该单词的词义、词根、例句、记忆技巧信息。
3. 生成的单词信息保存到 result/cet4/目录下,分别为: A.json B.json ... Z.json
タスク2
用 Python3.8 写一个单词助记图片生成工具gen_words_img.py, 详细需求如下:
1. 读取每一个 result/cet4/目录下 每个JSON文件中的所有单词信息,每个单词信息包括word、analysis、draw_explain、draw_prompt 4个字段。
2. 对每个单词调用replicate的接口(接口具体实现在provider_replicate.py:replicate_run)生成该单词的图片。
3. 生成的图片文件保存到 result/cet4_imgs/目录下,文件名称格式为:{first_letter_of_word}/{word}.jpg。如果对应图片文件已存在,则跳过本图片文件的生成。
4. 假设所有依赖库已经安装。
タスク3
用 Python3.8 写一个文章生成工具gen_articles.py, 为26个英文字母各生成一个文件,共26个文件,文件名格式为:2025-02-11-cet4-{letter}.md, 每个文件的内容组成如下:
"""
---
layout: post
title: "四级词汇-{letter}开头单词"
subtitle: "四级词汇-{letter}开头单词"
date: 2025-02-11
author: "vxiaozhi"
catalog: true
tags:
- english
- cet4
---
{{ for all word begin with letter}}
## word
{word.analysis}
{{end}}
"""
其中 word.analysis 通过读取 result/cet4/{letter}.json 获得,result/cet4/{letter}.json存储了{letter}开头的全部单词的信息,如果result/cet4/{letter}.json 不存在,则跳过该letter对应文件的生成。
更多约束如下:
1、2025-02-11-cet4-{letter}.md 保存到 result/cet4_articles 目录下。
2、Python 使用 3.8 版本。
3、假设所有Python依赖库已经安装。