VBDeepSeek: DeepSeek를 사용하여 4학년 단어 학습 자료를 생성하는 오픈 소스 도구입니다.

일반 소개

"Vocabulary Book by DeepSeek"은 영어 학습자가 대학 영어 레벨 4(CET-4)의 어휘를 효율적으로 습득할 수 있도록 돕는 것을 목표로 DeepSeek의 빅 모델을 기반으로 개발된 오픈 소스 프로젝트입니다. 개발자 vxiaozhi가 만든 이 프로젝트는 GitHub에서 호스팅되며, DeepSeek의 강력한 언어 생성 기능과 결합된 Python 스크립트를 통해 단어의 의미, 어근, 예문, 암기 기법 등이 포함된 어휘 학습 자료를 자동으로 생성합니다. 이 도구는 단어를 알파벳 순서로 정리하고, 출력 형식이 명확하며, JSON 파일 저장을 지원하므로 학생, 교사 또는 자가 학습자에게 적합합니다. 프로젝트 코드는 공개되어 있으며 80% 이상은 DeepSeek에서 자동으로 생성되어 교육에 AI의 혁신적인 적용을 반영합니다. 4학년을 준비하든 어휘력을 향상시키든 이 도구는 편리한 학습 지원을 제공합니다.

기능 목록

4학년 어휘 학습 자료 자동 생성딥서치 인터페이스를 호출하여 단어 의미, 어근 분석, 예문 및 기억 팁을 생성합니다.
알파벳순 저장CET-4 단어를 첫 글자에 따라 A부터 Z까지 JSON 파일로 나누면 쉽게 찾고 관리할 수 있습니다.
유용한 이미지 생성스크립트를 통해 단어와 관련된 니모닉 이미지를 생성하여 암기력을 향상시킵니다.
기사 생성기블로그나 노트 정리에 적합한 글자로 시작하는 마크다운 형식의 어휘 학습 글을 생성하세요.
오픈 소스 지원전체 Python 코드가 제공되며 사용자가 자유롭게 기능을 수정하거나 확장할 수 있습니다.

도움말 사용

설치 프로세스

'딥시크릿의 어휘장'은 특정 프로그래밍 환경이 필요한 파이썬 기반 도구로, 실행하려면 특정 프로그래밍 환경이 필요합니다. 아래는 자세한 설치 및 사용 단계입니다:

1. 환경 준비

Python 설치파이썬 3.8 이상이 시스템에 설치되어 있는지 확인합니다(파이썬 웹사이트에서 다운로드하여 설치할 수 있습니다).
복제 프로젝트터미널 또는 명령줄을 열고 다음 명령을 입력하여 프로젝트를 로컬로 다운로드합니다:
```
git clone https://github.com/vxiaozhi/vocabulary-book-by-deepseek.git
cd vocabulary-book-by-deepseek
```

종속성 설치이 프로젝트는 여러 Python 라이브러리를 사용하므로 다음 명령을 실행하여 설치합니다:
```
pip install -r requirements.txt
```
그렇지 않은 경우requirements.txt를 클릭하면 핵심 라이브러리를 수동으로 설치할 수 있습니다:
```
pip install requests openai pillow
```
DeepSeek API 구성: DeepSeek API 키가 필요합니다. 딥시크 계정에 가입한 후 딥시크 플랫폼에서 키를 받아 프로젝트 구성 파일 또는 코드의 API 호출 섹션에 입력합니다.

2. 주요 기능 사용

이 프로젝트는 단어 도우미 도구와 도우미 이미지 생성 도구라는 두 가지 핵심 스크립트로 구성되어 있습니다. 자세한 작업 흐름은 다음과 같습니다:

(1) 단어 학습 자료 생성

단어 데이터 준비프로젝트는 기본적으로 제공됩니다.data/cet4/디렉터리에서 문자 A-Z로 정렬된 JSON 파일(예A.json및B.json). 각 파일에는 해당 문자로 시작하는 단어 목록이 포함되어 있습니다.
스크립트 실행::
- 터미널을 열고 프로젝트 디렉토리로 이동합니다.
- 다음 명령을 실행하여 단어 분석을 생성합니다:
```
python cet4_word_helper.py
```
- 스크립트는data/cet4/목록의 단어는 DeepSeek API를 통해 단어의 의미, 어근, 예문 및 기억 팁을 생성하는 데 사용되며 결과는result/cet4/JSON 파일을 디렉터리에 저장합니다(예A.json).

결과 보기: 생성된 JSON 파일의 구조 예시입니다:

{
"word": "abandon",
"meaning": "放弃",
"root": "a-(加强) + bandon(控制)",
"example": "He had to abandon his car in the snow.",
"memory_tip": "想象一个人在雪地里放弃aband控制on车。"
}

(2) 니모닉 그림 생성하기

이미지 생성 스크립트 실행::
- 다음 명령을 실행합니다:
```
python gen_words_img.py
```
- 스크립트는 다음을 기반으로 합니다.result/cet4/스크립트의 단어 데이터는 니모닉 이미지를 생성하는 데 사용되며, 기본적으로 지정된 디렉터리에 저장됩니다(스크립트에서 출력 경로를 구성해야 함).
사용자 지정 설정수정 : 수정gen_words_img.py매개변수(예: 이미지 크기, 해상도 또는 스타일)를 사용하여 요구 사항을 충족하는 이미지가 생성되도록 할 수 있습니다.

(3) 어휘 기사 생성

문서 생성 스크립트 실행::
- 구현:
```
python gen_articles.py
```
- 스크립트 읽기result/cet4/을 사용하여 26개의 마크다운 파일(2025-02-11-cet4-A.md)에 저장하고result/cet4_articles/카탈로그.

출력 형식각 파일에는 학습 또는 공유에 적합한 문자로 시작하는 단어에 대한 분석이 포함되어 있습니다. 예시:

---
title: "四级词汇-A开头单词"
date: 2025-02-11
---
## abandon
词义：放弃  
词根：a-(加强) + bandon(控制)  
例句：He had to abandon his car in the snow.  
记忆技巧：想象一个人在雪地里放弃aband控制on车。

3. 운영 고려 사항

API 키 보안DeepSeek API 키를 스크립트에 직접 하드코딩하지 말고 환경 변수를 사용하여 저장하는 것이 좋습니다:
```
export DEEPSEEK_API_KEY='你的密钥'
```
네트워크 연결스크립트를 실행할 때 네트워크가 사용 가능한 상태인지 확인해야 합니다.
파일 경로 확인만약data/cet4/어쩌면result/cet4/디렉터리가 누락되었으므로 스크립트 경로 구성을 수동으로 만들거나 조정해야 합니다.
확장된 기능레벨 6 단어 지원을 추가하거나 출력 형식을 조정하는 등 필요에 따라 코드를 수정할 수 있습니다.

4. 특수 기능 작동

배치 파일메인 스크립트를 한 번만 실행하여 모든 문자에 대한 단어 프로필을 한 번에 생성합니다.
사진 지원 메모리생성된 보조 이미지를 전자 노트로 가져오거나 인쇄하여 텍스트 기반 학습과 함께 사용할 수 있습니다.
기사 공유마크다운 파일은 블로그 포스팅에 바로 사용하거나 노션과 같은 도구로 가져와 학습 노트를 정리하는 데 사용할 수 있습니다.

클라인 미션 단서

Task1

用 Python 写一个 cet4 单词助记工具，对单词进行词义词根分析、例举例句、并提供一些高效的记忆技巧和窍门。 详细需求如下：
1. 单词已经按照字母归类存储在data/cet4/目录下，分别为： A.json B.json ... Z.json
2. 读取每一个 data/cet4/目录下 每个JSON文件中的所有单词，对每个单词调用OpenAI的接口生成该单词的词义、词根、例句、记忆技巧信息。
3. 生成的单词信息保存到 result/cet4/目录下，分别为： A.json B.json ... Z.json

Task2

用 Python3.8 写一个单词助记图片生成工具gen_words_img.py， 详细需求如下：
1. 读取每一个 result/cet4/目录下 每个JSON文件中的所有单词信息，每个单词信息包括word、analysis、draw_explain、draw_prompt 4个字段。
2. 对每个单词调用replicate的接口(接口具体实现在provider_replicate.py:replicate_run)生成该单词的图片。
3. 生成的图片文件保存到 result/cet4_imgs/目录下，文件名称格式为：{first_letter_of_word}/{word}.jpg。如果对应图片文件已存在，则跳过本图片文件的生成。
4. 假设所有依赖库已经安装。

Task3

用 Python3.8 写一个文章生成工具gen_articles.py， 为26个英文字母各生成一个文件，共26个文件，文件名格式为：2025-02-11-cet4-{letter}.md, 每个文件的内容组成如下：
"""
---
layout:     post
title:      "四级词汇-{letter}开头单词"
subtitle:   "四级词汇-{letter}开头单词"
date:       2025-02-11
author:     "vxiaozhi"
catalog: true
tags:
- english
- cet4
---

{{ for all word begin with letter}}
## word
{word.analysis}
{{end}}
"""
其中 word.analysis 通过读取 result/cet4/{letter}.json 获得，result/cet4/{letter}.json存储了{letter}开头的全部单词的信息，如果result/cet4/{letter}.json 不存在，则跳过该letter对应文件的生成。
更多约束如下：
1、2025-02-11-cet4-{letter}.md 保存到 result/cet4_articles 目录下。
2、Python 使用 3.8 版本。
3、假设所有Python依赖库已经安装。