Aprendizagem pessoal com IA
e orientação prática
豆包Marscode1

VBDeepSeek: uma ferramenta de código aberto para gerar materiais de estudo de palavras da 4ª série usando o DeepSeek

Introdução geral

O "Vocabulary Book by DeepSeek" é um projeto de código aberto desenvolvido com base no grande modelo do DeepSeek, com o objetivo de ajudar os alunos de inglês a dominar com eficiência o vocabulário do College English Level 4 (CET-4). O projeto está hospedado no GitHub, criado pelo desenvolvedor vxiaozhi, por meio do script Python combinado com os poderosos recursos de geração de linguagem do DeepSeek, gera automaticamente materiais de aprendizagem de vocabulário que contêm significados de palavras, palavras-raiz, frases de exemplo e técnicas de memorização. A ferramenta organiza as palavras em ordem alfabética, tem um formato de saída claro, é compatível com o armazenamento de arquivos JSON e é adequada para alunos, professores ou autodidatas. O código do projeto é aberto e 80% ou mais é gerado automaticamente pelo DeepSeek, refletindo a aplicação inovadora da IA na educação. Quer esteja se preparando para a 4ª série ou melhorando seu vocabulário, essa ferramenta oferece um suporte de aprendizado conveniente.

VBDeepSeek:使用DeepSeek生成四级单词学习资料的开源工具-1


 

Lista de funções

  • Geração automática de materiais de estudo de vocabulário da 4ª sérieChamada da interface do DeepSeek para gerar significados de palavras, análises de raízes, frases de exemplo e dicas de memória.
  • Armazenamento em ordem alfabéticaPalavras CET-4: Divida as palavras CET-4 em arquivos JSON de A a Z, de acordo com a primeira letra, para facilitar a localização e o gerenciamento.
  • Geração de imagens úteisGeração de imagens mnemônicas relacionadas a palavras por meio de scripts para melhorar a memorização.
  • Gerador de artigosGerar artigos de aprendizado de vocabulário no formato Markdown, começando com uma letra, adequado para blogs ou organização de notas.
  • Suporte a código abertoCódigo Python completo é fornecido e os usuários são livres para modificar ou ampliar a funcionalidade.

 

Usando a Ajuda

Processo de instalação

O "Vocabulary Book by DeepSeek" é uma ferramenta baseada em Python que requer um determinado ambiente de programação para ser executado. Abaixo estão as etapas detalhadas de instalação e uso:

1. preparação ambiental

  • Instalação do PythonVerifique se o Python 3.8 ou superior está instalado em seu sistema, que pode ser baixado e instalado no site do Python.
  • projeto de clonagemAbra um terminal ou uma linha de comando e digite o seguinte comando para fazer o download do projeto localmente:
    git clone https://github.com/vxiaozhi/vocabulary-book-by-deepseek.git
    cd vocabulary-book-by-deepseek
  • Instalação de dependênciasO projeto depende de várias bibliotecas Python; execute o seguinte comando para instalá-las:
    pip install -r requirements.txt
    

    se nãorequirements.txtA biblioteca principal pode ser instalada manualmente:

    pip install requests openai pillow
    
  • Configuração da API do DeepSeekÉ necessária uma chave API do DeepSeek. Depois de se inscrever para uma conta DeepSeek, obtenha a chave na plataforma DeepSeek e preencha a seção de chamada de API no arquivo ou código de configuração do projeto.

2. uso das principais funções

O projeto consiste em dois scripts principais: a ferramenta auxiliar de palavras e a ferramenta auxiliar de geração de imagens. A seguir, o fluxo de operação detalhado:

(1) Gerar materiais de estudo de palavras
  • Preparar dados do Word: Os projetos são fornecidos por padrãodata/cet4/Arquivos JSON classificados por letras de A a Z no diretório (por exemploA.jsoneB.json). Cada arquivo contém uma lista de palavras que começam com a letra correspondente.
  • Executando scripts::
    • Abra um terminal e vá para o diretório do projeto.
    • Execute o seguinte comando para gerar uma análise de palavras:
      python cet4_word_helper.py
      
    • O script lerá odata/cet4/As palavras da lista são usadas para gerar significados de palavras, raízes, frases de exemplo e dicas de memória por meio da API do DeepSeek, e os resultados são salvos no arquivoresult/cet4/arquivo JSON no diretório (por exemploA.json).
  • Exibir resultadosExemplo da estrutura do arquivo JSON gerado:
    {
    "word": "abandon",
    "meaning": "放弃",
    "root": "a-(加强) + bandon(控制)",
    "example": "He had to abandon his car in the snow.",
    "memory_tip": "想象一个人在雪地里放弃aband控制on车。"
    }
    
(2) Geração de imagens mnemônicas
  • Execute o script de geração de imagem::
    • Execute o seguinte comando:
      python gen_words_img.py
      
    • O script será baseado noresult/cet4/Os dados de palavras no script são usados para gerar imagens mnemônicas, que são salvas no diretório especificado por padrão (é necessário configurar o caminho de saída no script).
  • Configurações personalizadasModificaçãogen_words_img.pyparâmetros, como tamanho, resolução ou estilo da imagem, para garantir que as imagens geradas atendam aos requisitos.
(3) Gerar artigos de vocabulário
  • Executar o script de geração de artigos::
    • Implementação:
      python gen_articles.py
      
    • Leitura do roteiroresult/cet4/no arquivo JSON, gerando 26 arquivos Markdown (como o2025-02-11-cet4-A.md), salve emresult/cet4_articles/Catálogo.
  • formato de saídaCada arquivo contém análises de palavras que começam com letras, adequadas para aprendizado ou compartilhamento. Exemplo:
    ---
    title: "四级词汇-A开头单词"
    date: 2025-02-11
    ---
    ## abandon
    词义:放弃  
    词根:a-(加强) + bandon(控制)  
    例句:He had to abandon his car in the snow.  
    记忆技巧:想象一个人在雪地里放弃aband控制on车。
    

3. considerações operacionais

  • Segurança da chave de APINão codifique as chaves da API do DeepSeek diretamente nos scripts; é recomendável usar variáveis de ambiente para armazená-las:
    export DEEPSEEK_API_KEY='你的密钥'
    
  • conexão de redeVerifique se a rede está livre ao executar o script, pois ele depende da API do DeepSeek.
  • Verificação do caminho do arquivoSedata/cet4/talvezresult/cet4/O diretório está ausente, você precisa criar ou ajustar manualmente a configuração do caminho do script.
  • Funcionalidade estendidaO código pode ser modificado conforme necessário, por exemplo, para adicionar suporte a palavras de nível 6 ou para ajustar o formato de saída.

4. operação de recursos especiais

  • arquivo de loteGerar perfis de palavras para todas as letras de uma só vez, executando o script principal apenas uma vez.
  • Memória assistida por imagemImagens de auxílios gerados podem ser importadas para anotações eletrônicas ou impressas para complementar o aprendizado baseado em texto.
  • Compartilhamento de artigosArquivos Markdown: os arquivos Markdown podem ser usados diretamente para publicação em blogs ou importados para ferramentas como o Notion para organizar anotações de estudo.

 

Pistas da missão Cline

Tarefa1

用 Python 写一个 cet4 单词助记工具,对单词进行词义词根分析、例举例句、并提供一些高效的记忆技巧和窍门。 详细需求如下:
1. 单词已经按照字母归类存储在data/cet4/目录下,分别为: A.json B.json ... Z.json
2. 读取每一个 data/cet4/目录下 每个JSON文件中的所有单词,对每个单词调用OpenAI的接口生成该单词的词义、词根、例句、记忆技巧信息。
3. 生成的单词信息保存到 result/cet4/目录下,分别为: A.json B.json ... Z.json

Tarefa2

用 Python3.8 写一个单词助记图片生成工具gen_words_img.py, 详细需求如下:
1. 读取每一个 result/cet4/目录下 每个JSON文件中的所有单词信息,每个单词信息包括word、analysis、draw_explain、draw_prompt 4个字段。
2. 对每个单词调用replicate的接口(接口具体实现在provider_replicate.py:replicate_run)生成该单词的图片。
3. 生成的图片文件保存到 result/cet4_imgs/目录下,文件名称格式为:{first_letter_of_word}/{word}.jpg。如果对应图片文件已存在,则跳过本图片文件的生成。
4. 假设所有依赖库已经安装。

Tarefa3

用 Python3.8 写一个文章生成工具gen_articles.py, 为26个英文字母各生成一个文件,共26个文件,文件名格式为:2025-02-11-cet4-{letter}.md, 每个文件的内容组成如下:
"""
---
layout:     post
title:      "四级词汇-{letter}开头单词"
subtitle:   "四级词汇-{letter}开头单词"
date:       2025-02-11
author:     "vxiaozhi"
catalog: true
tags:
- english
- cet4
---

{{ for all word begin with letter}}
## word
{word.analysis}
{{end}}
"""
其中 word.analysis 通过读取 result/cet4/{letter}.json 获得,result/cet4/{letter}.json存储了{letter}开头的全部单词的信息,如果result/cet4/{letter}.json 不存在,则跳过该letter对应文件的生成。
更多约束如下:
1、2025-02-11-cet4-{letter}.md 保存到 result/cet4_articles 目录下。
2、Python 使用 3.8 版本。
3、假设所有Python依赖库已经安装。
Não pode ser reproduzido sem permissão:Chefe do Círculo de Compartilhamento de IA " VBDeepSeek: uma ferramenta de código aberto para gerar materiais de estudo de palavras da 4ª série usando o DeepSeek
pt_BRPortuguês do Brasil