VBDeepSeek: DeepSeek를 사용하여 4학년 단어 학습 자료를 생성하는 오픈 소스 도구입니다.

일반 소개

"Vocabulary Book by DeepSeek"은 영어 학습자가 대학 영어 레벨 4(CET-4)의 어휘를 효율적으로 습득할 수 있도록 돕는 것을 목표로 DeepSeek의 빅 모델을 기반으로 개발된 오픈 소스 프로젝트입니다. 개발자 vxiaozhi가 만든 이 프로젝트는 GitHub에서 호스팅되며, DeepSeek의 강력한 언어 생성 기능과 결합된 Python 스크립트를 통해 단어의 의미, 어근, 예문, 암기 기법 등이 포함된 어휘 학습 자료를 자동으로 생성합니다. 이 도구는 단어를 알파벳 순서로 정리하고, 출력 형식이 명확하며, JSON 파일 저장을 지원하므로 학생, 교사 또는 자가 학습자에게 적합합니다. 프로젝트 코드는 공개되어 있으며 80% 이상은 DeepSeek에서 자동으로 생성되어 교육에 AI의 혁신적인 적용을 반영합니다. 4학년을 준비하든 어휘력을 향상시키든 이 도구는 편리한 학습 지원을 제공합니다.

VBDeepSeek:使用DeepSeek生成四级单词学习资料的开源工具

 

기능 목록

  • 4학년 어휘 학습 자료 자동 생성딥서치 인터페이스를 호출하여 단어 의미, 어근 분석, 예문 및 기억 팁을 생성합니다.
  • 알파벳순 저장CET-4 단어를 첫 글자에 따라 A부터 Z까지 JSON 파일로 나누면 쉽게 찾고 관리할 수 있습니다.
  • 유용한 이미지 생성스크립트를 통해 단어와 관련된 니모닉 이미지를 생성하여 암기력을 향상시킵니다.
  • 기사 생성기블로그나 노트 정리에 적합한 글자로 시작하는 마크다운 형식의 어휘 학습 글을 생성하세요.
  • 오픈 소스 지원전체 Python 코드가 제공되며 사용자가 자유롭게 기능을 수정하거나 확장할 수 있습니다.

 

도움말 사용

설치 프로세스

'딥시크릿의 어휘장'은 특정 프로그래밍 환경이 필요한 파이썬 기반 도구로, 실행하려면 특정 프로그래밍 환경이 필요합니다. 아래는 자세한 설치 및 사용 단계입니다:

1. 환경 준비

  • Python 설치파이썬 3.8 이상이 시스템에 설치되어 있는지 확인합니다(파이썬 웹사이트에서 다운로드하여 설치할 수 있습니다).
  • 복제 프로젝트터미널 또는 명령줄을 열고 다음 명령을 입력하여 프로젝트를 로컬로 다운로드합니다:
    git clone https://github.com/vxiaozhi/vocabulary-book-by-deepseek.git
    cd vocabulary-book-by-deepseek
  • 종속성 설치이 프로젝트는 여러 Python 라이브러리를 사용하므로 다음 명령을 실행하여 설치합니다:
    pip install -r requirements.txt
    

    그렇지 않은 경우requirements.txt를 클릭하면 핵심 라이브러리를 수동으로 설치할 수 있습니다:

    pip install requests openai pillow
    
  • DeepSeek API 구성: DeepSeek API 키가 필요합니다. 딥시크 계정에 가입한 후 딥시크 플랫폼에서 키를 받아 프로젝트 구성 파일 또는 코드의 API 호출 섹션에 입력합니다.

2. 주요 기능 사용

이 프로젝트는 단어 도우미 도구와 도우미 이미지 생성 도구라는 두 가지 핵심 스크립트로 구성되어 있습니다. 자세한 작업 흐름은 다음과 같습니다:

(1) 단어 학습 자료 생성
  • 단어 데이터 준비프로젝트는 기본적으로 제공됩니다.data/cet4/디렉터리에서 문자 A-Z로 정렬된 JSON 파일(예A.jsonB.json). 각 파일에는 해당 문자로 시작하는 단어 목록이 포함되어 있습니다.
  • 스크립트 실행::
    • 터미널을 열고 프로젝트 디렉토리로 이동합니다.
    • 다음 명령을 실행하여 단어 분석을 생성합니다:
      python cet4_word_helper.py
      
    • 스크립트는data/cet4/목록의 단어는 DeepSeek API를 통해 단어의 의미, 어근, 예문 및 기억 팁을 생성하는 데 사용되며 결과는result/cet4/JSON 파일을 디렉터리에 저장합니다(예A.json).
  • 결과 보기: 생성된 JSON 파일의 구조 예시입니다:
    {
    "word": "abandon",
    "meaning": "放弃",
    "root": "a-(加强) + bandon(控制)",
    "example": "He had to abandon his car in the snow.",
    "memory_tip": "想象一个人在雪地里放弃aband控制on车。"
    }
    
(2) 니모닉 그림 생성하기
  • 이미지 생성 스크립트 실행::
    • 다음 명령을 실행합니다:
      python gen_words_img.py
      
    • 스크립트는 다음을 기반으로 합니다.result/cet4/스크립트의 단어 데이터는 니모닉 이미지를 생성하는 데 사용되며, 기본적으로 지정된 디렉터리에 저장됩니다(스크립트에서 출력 경로를 구성해야 함).
  • 사용자 지정 설정수정 : 수정gen_words_img.py매개변수(예: 이미지 크기, 해상도 또는 스타일)를 사용하여 요구 사항을 충족하는 이미지가 생성되도록 할 수 있습니다.
(3) 어휘 기사 생성
  • 문서 생성 스크립트 실행::
    • 구현:
      python gen_articles.py
      
    • 스크립트 읽기result/cet4/을 사용하여 26개의 마크다운 파일(2025-02-11-cet4-A.md)에 저장하고result/cet4_articles/카탈로그.
  • 출력 형식각 파일에는 학습 또는 공유에 적합한 문자로 시작하는 단어에 대한 분석이 포함되어 있습니다. 예시:
    ---
    title: "四级词汇-A开头单词"
    date: 2025-02-11
    ---
    ## abandon
    词义:放弃  
    词根:a-(加强) + bandon(控制)  
    例句:He had to abandon his car in the snow.  
    记忆技巧:想象一个人在雪地里放弃aband控制on车。
    

3. 운영 고려 사항

  • API 키 보안DeepSeek API 키를 스크립트에 직접 하드코딩하지 말고 환경 변수를 사용하여 저장하는 것이 좋습니다:
    export DEEPSEEK_API_KEY='你的密钥'
    
  • 네트워크 연결스크립트를 실행할 때 네트워크가 사용 가능한 상태인지 확인해야 합니다.
  • 파일 경로 확인만약data/cet4/어쩌면result/cet4/디렉터리가 누락되었으므로 스크립트 경로 구성을 수동으로 만들거나 조정해야 합니다.
  • 확장된 기능레벨 6 단어 지원을 추가하거나 출력 형식을 조정하는 등 필요에 따라 코드를 수정할 수 있습니다.

4. 특수 기능 작동

  • 배치 파일메인 스크립트를 한 번만 실행하여 모든 문자에 대한 단어 프로필을 한 번에 생성합니다.
  • 사진 지원 메모리생성된 보조 이미지를 전자 노트로 가져오거나 인쇄하여 텍스트 기반 학습과 함께 사용할 수 있습니다.
  • 기사 공유마크다운 파일은 블로그 포스팅에 바로 사용하거나 노션과 같은 도구로 가져와 학습 노트를 정리하는 데 사용할 수 있습니다.

 

클라인 미션 단서

Task1

用 Python 写一个 cet4 单词助记工具,对单词进行词义词根分析、例举例句、并提供一些高效的记忆技巧和窍门。 详细需求如下:
1. 单词已经按照字母归类存储在data/cet4/目录下,分别为: A.json B.json ... Z.json
2. 读取每一个 data/cet4/目录下 每个JSON文件中的所有单词,对每个单词调用OpenAI的接口生成该单词的词义、词根、例句、记忆技巧信息。
3. 生成的单词信息保存到 result/cet4/目录下,分别为: A.json B.json ... Z.json

Task2

用 Python3.8 写一个单词助记图片生成工具gen_words_img.py, 详细需求如下:
1. 读取每一个 result/cet4/目录下 每个JSON文件中的所有单词信息,每个单词信息包括word、analysis、draw_explain、draw_prompt 4个字段。
2. 对每个单词调用replicate的接口(接口具体实现在provider_replicate.py:replicate_run)生成该单词的图片。
3. 生成的图片文件保存到 result/cet4_imgs/目录下,文件名称格式为:{first_letter_of_word}/{word}.jpg。如果对应图片文件已存在,则跳过本图片文件的生成。
4. 假设所有依赖库已经安装。

Task3

用 Python3.8 写一个文章生成工具gen_articles.py, 为26个英文字母各生成一个文件,共26个文件,文件名格式为:2025-02-11-cet4-{letter}.md, 每个文件的内容组成如下:
"""
---
layout:     post
title:      "四级词汇-{letter}开头单词"
subtitle:   "四级词汇-{letter}开头单词"
date:       2025-02-11
author:     "vxiaozhi"
catalog: true
tags:
- english
- cet4
---

{{ for all word begin with letter}}
## word
{word.analysis}
{{end}}
"""
其中 word.analysis 通过读取 result/cet4/{letter}.json 获得,result/cet4/{letter}.json存储了{letter}开头的全部单词的信息,如果result/cet4/{letter}.json 不存在,则跳过该letter对应文件的生成。
更多约束如下:
1、2025-02-11-cet4-{letter}.md 保存到 result/cet4_articles 目录下。
2、Python 使用 3.8 版本。
3、假设所有Python依赖库已经安装。
© 저작권 정책

관련 문서

댓글 없음

댓글에 참여하려면 로그인해야 합니다!
지금 로그인
없음
댓글 없음...