일반 소개
"Vocabulary Book by DeepSeek"은 영어 학습자가 대학 영어 레벨 4(CET-4)의 어휘를 효율적으로 습득할 수 있도록 돕는 것을 목표로 DeepSeek의 빅 모델을 기반으로 개발된 오픈 소스 프로젝트입니다. 개발자 vxiaozhi가 만든 이 프로젝트는 GitHub에서 호스팅되며, DeepSeek의 강력한 언어 생성 기능과 결합된 Python 스크립트를 통해 단어의 의미, 어근, 예문, 암기 기법 등이 포함된 어휘 학습 자료를 자동으로 생성합니다. 이 도구는 단어를 알파벳 순서로 정리하고, 출력 형식이 명확하며, JSON 파일 저장을 지원하므로 학생, 교사 또는 자가 학습자에게 적합합니다. 프로젝트 코드는 공개되어 있으며 80% 이상은 DeepSeek에서 자동으로 생성되어 교육에 AI의 혁신적인 적용을 반영합니다. 4학년을 준비하든 어휘력을 향상시키든 이 도구는 편리한 학습 지원을 제공합니다.

기능 목록
- 4학년 어휘 학습 자료 자동 생성딥서치 인터페이스를 호출하여 단어 의미, 어근 분석, 예문 및 기억 팁을 생성합니다.
- 알파벳순 저장CET-4 단어를 첫 글자에 따라 A부터 Z까지 JSON 파일로 나누면 쉽게 찾고 관리할 수 있습니다.
- 유용한 이미지 생성스크립트를 통해 단어와 관련된 니모닉 이미지를 생성하여 암기력을 향상시킵니다.
- 기사 생성기블로그나 노트 정리에 적합한 글자로 시작하는 마크다운 형식의 어휘 학습 글을 생성하세요.
- 오픈 소스 지원전체 Python 코드가 제공되며 사용자가 자유롭게 기능을 수정하거나 확장할 수 있습니다.
도움말 사용
설치 프로세스
'딥시크릿의 어휘장'은 특정 프로그래밍 환경이 필요한 파이썬 기반 도구로, 실행하려면 특정 프로그래밍 환경이 필요합니다. 아래는 자세한 설치 및 사용 단계입니다:
1. 환경 준비
- Python 설치파이썬 3.8 이상이 시스템에 설치되어 있는지 확인합니다(파이썬 웹사이트에서 다운로드하여 설치할 수 있습니다).
- 복제 프로젝트터미널 또는 명령줄을 열고 다음 명령을 입력하여 프로젝트를 로컬로 다운로드합니다:
git clone https://github.com/vxiaozhi/vocabulary-book-by-deepseek.git cd vocabulary-book-by-deepseek
- 종속성 설치이 프로젝트는 여러 Python 라이브러리를 사용하므로 다음 명령을 실행하여 설치합니다:
pip install -r requirements.txt
그렇지 않은 경우
requirements.txt
를 클릭하면 핵심 라이브러리를 수동으로 설치할 수 있습니다:pip install requests openai pillow
- DeepSeek API 구성: DeepSeek API 키가 필요합니다. 딥시크 계정에 가입한 후 딥시크 플랫폼에서 키를 받아 프로젝트 구성 파일 또는 코드의 API 호출 섹션에 입력합니다.
2. 주요 기능 사용
이 프로젝트는 단어 도우미 도구와 도우미 이미지 생성 도구라는 두 가지 핵심 스크립트로 구성되어 있습니다. 자세한 작업 흐름은 다음과 같습니다:
(1) 단어 학습 자료 생성
- 단어 데이터 준비프로젝트는 기본적으로 제공됩니다.
data/cet4/
디렉터리에서 문자 A-Z로 정렬된 JSON 파일(예A.json
및B.json
). 각 파일에는 해당 문자로 시작하는 단어 목록이 포함되어 있습니다. - 스크립트 실행::
- 터미널을 열고 프로젝트 디렉토리로 이동합니다.
- 다음 명령을 실행하여 단어 분석을 생성합니다:
python cet4_word_helper.py
- 스크립트는
data/cet4/
목록의 단어는 DeepSeek API를 통해 단어의 의미, 어근, 예문 및 기억 팁을 생성하는 데 사용되며 결과는result/cet4/
JSON 파일을 디렉터리에 저장합니다(예A.json
).
- 결과 보기: 생성된 JSON 파일의 구조 예시입니다:
{ "word": "abandon", "meaning": "放弃", "root": "a-(加强) + bandon(控制)", "example": "He had to abandon his car in the snow.", "memory_tip": "想象一个人在雪地里放弃aband控制on车。" }
(2) 니모닉 그림 생성하기
- 이미지 생성 스크립트 실행::
- 다음 명령을 실행합니다:
python gen_words_img.py
- 스크립트는 다음을 기반으로 합니다.
result/cet4/
스크립트의 단어 데이터는 니모닉 이미지를 생성하는 데 사용되며, 기본적으로 지정된 디렉터리에 저장됩니다(스크립트에서 출력 경로를 구성해야 함).
- 다음 명령을 실행합니다:
- 사용자 지정 설정수정 : 수정
gen_words_img.py
매개변수(예: 이미지 크기, 해상도 또는 스타일)를 사용하여 요구 사항을 충족하는 이미지가 생성되도록 할 수 있습니다.
(3) 어휘 기사 생성
- 문서 생성 스크립트 실행::
- 구현:
python gen_articles.py
- 스크립트 읽기
result/cet4/
을 사용하여 26개의 마크다운 파일(2025-02-11-cet4-A.md
)에 저장하고result/cet4_articles/
카탈로그.
- 구현:
- 출력 형식각 파일에는 학습 또는 공유에 적합한 문자로 시작하는 단어에 대한 분석이 포함되어 있습니다. 예시:
--- title: "四级词汇-A开头单词" date: 2025-02-11 --- ## abandon 词义:放弃 词根:a-(加强) + bandon(控制) 例句:He had to abandon his car in the snow. 记忆技巧:想象一个人在雪地里放弃aband控制on车。
3. 운영 고려 사항
- API 키 보안DeepSeek API 키를 스크립트에 직접 하드코딩하지 말고 환경 변수를 사용하여 저장하는 것이 좋습니다:
export DEEPSEEK_API_KEY='你的密钥'
- 네트워크 연결스크립트를 실행할 때 네트워크가 사용 가능한 상태인지 확인해야 합니다.
- 파일 경로 확인만약
data/cet4/
어쩌면result/cet4/
디렉터리가 누락되었으므로 스크립트 경로 구성을 수동으로 만들거나 조정해야 합니다. - 확장된 기능레벨 6 단어 지원을 추가하거나 출력 형식을 조정하는 등 필요에 따라 코드를 수정할 수 있습니다.
4. 특수 기능 작동
- 배치 파일메인 스크립트를 한 번만 실행하여 모든 문자에 대한 단어 프로필을 한 번에 생성합니다.
- 사진 지원 메모리생성된 보조 이미지를 전자 노트로 가져오거나 인쇄하여 텍스트 기반 학습과 함께 사용할 수 있습니다.
- 기사 공유마크다운 파일은 블로그 포스팅에 바로 사용하거나 노션과 같은 도구로 가져와 학습 노트를 정리하는 데 사용할 수 있습니다.
클라인 미션 단서
Task1
用 Python 写一个 cet4 单词助记工具,对单词进行词义词根分析、例举例句、并提供一些高效的记忆技巧和窍门。 详细需求如下:
1. 单词已经按照字母归类存储在data/cet4/目录下,分别为: A.json B.json ... Z.json
2. 读取每一个 data/cet4/目录下 每个JSON文件中的所有单词,对每个单词调用OpenAI的接口生成该单词的词义、词根、例句、记忆技巧信息。
3. 生成的单词信息保存到 result/cet4/目录下,分别为: A.json B.json ... Z.json
Task2
用 Python3.8 写一个单词助记图片生成工具gen_words_img.py, 详细需求如下:
1. 读取每一个 result/cet4/目录下 每个JSON文件中的所有单词信息,每个单词信息包括word、analysis、draw_explain、draw_prompt 4个字段。
2. 对每个单词调用replicate的接口(接口具体实现在provider_replicate.py:replicate_run)生成该单词的图片。
3. 生成的图片文件保存到 result/cet4_imgs/目录下,文件名称格式为:{first_letter_of_word}/{word}.jpg。如果对应图片文件已存在,则跳过本图片文件的生成。
4. 假设所有依赖库已经安装。
Task3
用 Python3.8 写一个文章生成工具gen_articles.py, 为26个英文字母各生成一个文件,共26个文件,文件名格式为:2025-02-11-cet4-{letter}.md, 每个文件的内容组成如下:
"""
---
layout: post
title: "四级词汇-{letter}开头单词"
subtitle: "四级词汇-{letter}开头单词"
date: 2025-02-11
author: "vxiaozhi"
catalog: true
tags:
- english
- cet4
---
{{ for all word begin with letter}}
## word
{word.analysis}
{{end}}
"""
其中 word.analysis 通过读取 result/cet4/{letter}.json 获得,result/cet4/{letter}.json存储了{letter}开头的全部单词的信息,如果result/cet4/{letter}.json 不存在,则跳过该letter对应文件的生成。
更多约束如下:
1、2025-02-11-cet4-{letter}.md 保存到 result/cet4_articles 目录下。
2、Python 使用 3.8 版本。
3、假设所有Python依赖库已经安装。
© 저작권 정책
기사 저작권 AI 공유 서클 모두 무단 복제하지 마세요.
관련 문서
댓글 없음...