VBDeepSeek: инструмент с открытым исходным кодом для создания материалов для изучения слов в 4 классе с помощью DeepSeek

Общее введение

"Vocabulary Book by DeepSeek" - это проект с открытым исходным кодом, разработанный на основе большой модели DeepSeek и призванный помочь изучающим английский язык эффективно освоить лексику College English Level 4 (CET-4). Проект размещен на GitHub, создан разработчиком vxiaozhi. С помощью скрипта на Python в сочетании с мощными возможностями DeepSeek по генерации языка автоматически генерируются учебные материалы по лексике, содержащие значения слов, корневые слова, примеры предложений и техники запоминания. Инструмент упорядочивает слова в алфавитном порядке, имеет понятный формат вывода, поддерживает хранение файлов в формате JSON и подходит для студентов, преподавателей и самообучающихся. Код проекта открыт, и 80% или более автоматически генерируется DeepSeek, отражая инновационное применение ИИ в образовании. Готовитесь ли вы к четвертому классу или пополняете свой словарный запас, этот инструмент обеспечит удобную поддержку в обучении.

VBDeepSeek:使用DeepSeek生成四级单词学习资料的开源工具

 

Список функций

  • Автоматическое создание материалов для изучения лексики 4 класса: Вызывает интерфейс DeepSeek для создания значений слов, анализа корней, примеров предложений и подсказок для запоминания.
  • Хранение по алфавиту: Разделите слова CET-4 на JSON-файлы от A до Z в соответствии с первой буквой, легко находить и управлять.
  • Генерация полезных изображений: Создание мнемонических образов, связанных со словами, с помощью сценариев для улучшения запоминания.
  • Генератор статей: Создавайте статьи для изучения лексики в формате Markdown, начинающиеся с буквы, подходящие для ведения блога или организации заметок.
  • Поддержка открытых источников: Предоставляется полный код на языке Python, и пользователи могут свободно модифицировать или расширять функциональность.

 

Использование помощи

Процесс установки

"Vocabulary Book by DeepSeek" - это инструмент на основе Python, для запуска которого требуется определенная среда программирования. Ниже приведены подробные шаги по установке и использованию:

1. Подготовка окружающей среды

  • Установка Python: Убедитесь, что в вашей системе установлен Python 3.8 или выше, который можно загрузить и установить с сайта Python.
  • проект клонирования: Откройте терминал или командную строку и введите следующую команду, чтобы загрузить проект локально:
    git clone https://github.com/vxiaozhi/vocabulary-book-by-deepseek.git
    cd vocabulary-book-by-deepseek
  • Установка зависимостей: Проект полагается на несколько библиотек Python, выполните следующую команду для их установки:
    pip install -r requirements.txt
    

    если нетrequirements.txtБиблиотеку ядра можно установить вручную:

    pip install requests openai pillow
    
  • Настройка API DeepSeek: Требуется ключ API DeepSeek. После регистрации учетной записи DeepSeek получите ключ в платформе DeepSeek и введите его в раздел вызова API в конфигурационном файле или коде проекта.

2. Использование основных функций

Проект состоит из двух основных скриптов: инструмента для создания слов и инструмента для создания изображений. Ниже приводится подробная схема работы:

(1) Создание материалов для изучения слов
  • Подготовка словесных данных: Проекты предоставляются по умолчаниюdata/cet4/JSON-файлы, отсортированные по буквам A-Z в каталоге (например.A.json, иB.json). Каждый файл содержит список слов, начинающихся на соответствующую букву.
  • Выполнение сценариев::
    • Откройте терминал и перейдите в каталог проекта.
    • Выполните следующую команду, чтобы создать анализ слов:
      python cet4_word_helper.py
      
    • Скрипт прочитаетdata/cet4/Слова в списке используются для генерации значений слов, корней, примеров предложений и подсказок для запоминания через DeepSeek API, а результаты сохраняются вresult/cet4/JSON-файл в каталоге (например.A.json).
  • Посмотреть результаты: Пример структуры сгенерированного JSON-файла:
    {
    "word": "abandon",
    "meaning": "放弃",
    "root": "a-(加强) + bandon(控制)",
    "example": "He had to abandon his car in the snow.",
    "memory_tip": "想象一个人在雪地里放弃aband控制on车。"
    }
    
(2) Создание мнемонических картинок
  • Запустите сценарий создания изображения::
    • Выполните следующую команду:
      python gen_words_img.py
      
    • Сценарии будут основаны наresult/cet4/Данные слова в скрипте используются для создания мнемонических изображений, которые по умолчанию сохраняются в указанную директорию (вам необходимо настроить путь вывода в скрипте).
  • Пользовательские настройки: Модификацияgen_words_img.pyпараметры, такие как размер, разрешение или стиль изображения, чтобы гарантировать, что будут созданы изображения, соответствующие требованиям.
(3) Создание словарных статей
  • Запустите сценарий создания статьи::
    • Реализация:
      python gen_articles.py
      
    • Чтение сценарияresult/cet4/в JSON-файле, генерируя 26 Markdown-файлов (таких как2025-02-11-cet4-A.md), сохраните вresult/cet4_articles/Каталог.
  • формат вывода: Каждый файл содержит анализ слов, начинающихся с букв, подходящий для изучения или совместного использования. Пример:
    ---
    title: "四级词汇-A开头单词"
    date: 2025-02-11
    ---
    ## abandon
    词义:放弃  
    词根:a-(加强) + bandon(控制)  
    例句:He had to abandon his car in the snow.  
    记忆技巧:想象一个人在雪地里放弃aband控制on车。
    

3. оперативные соображения

  • Безопасность ключей API: Не вводите ключи API DeepSeek непосредственно в скрипты, рекомендуется использовать переменные окружения для их хранения:
    export DEEPSEEK_API_KEY='你的密钥'
    
  • сетевое подключение: Убедитесь, что сеть свободна при запуске сценария, так как он использует API DeepSeek.
  • Проверка пути к файлуЕслиdata/cet4/возможноresult/cet4/Директория отсутствует, необходимо вручную создать или настроить путь к сценарию.
  • Расширенная функциональность: Код может быть изменен по мере необходимости, например, для добавления поддержки слов 6-го уровня или изменения формата вывода.

4. Эксплуатация специальных функций

  • пакетный файл: Генерируйте профили слов для всех букв сразу, запуская основной скрипт только один раз.
  • Память с картинкамиСозданные вспомогательные изображения можно импортировать в электронные конспекты или распечатать, чтобы дополнить текстовое обучение.
  • Совместное использование статейФайлы Markdown можно использовать непосредственно для публикации в блоге или импортировать в такие инструменты, как Notion, для организации учебных заметок.

 

Миссия Клайн

Задание1

用 Python 写一个 cet4 单词助记工具,对单词进行词义词根分析、例举例句、并提供一些高效的记忆技巧和窍门。 详细需求如下:
1. 单词已经按照字母归类存储在data/cet4/目录下,分别为: A.json B.json ... Z.json
2. 读取每一个 data/cet4/目录下 每个JSON文件中的所有单词,对每个单词调用OpenAI的接口生成该单词的词义、词根、例句、记忆技巧信息。
3. 生成的单词信息保存到 result/cet4/目录下,分别为: A.json B.json ... Z.json

Задача2

用 Python3.8 写一个单词助记图片生成工具gen_words_img.py, 详细需求如下:
1. 读取每一个 result/cet4/目录下 每个JSON文件中的所有单词信息,每个单词信息包括word、analysis、draw_explain、draw_prompt 4个字段。
2. 对每个单词调用replicate的接口(接口具体实现在provider_replicate.py:replicate_run)生成该单词的图片。
3. 生成的图片文件保存到 result/cet4_imgs/目录下,文件名称格式为:{first_letter_of_word}/{word}.jpg。如果对应图片文件已存在,则跳过本图片文件的生成。
4. 假设所有依赖库已经安装。

Задание3

用 Python3.8 写一个文章生成工具gen_articles.py, 为26个英文字母各生成一个文件,共26个文件,文件名格式为:2025-02-11-cet4-{letter}.md, 每个文件的内容组成如下:
"""
---
layout:     post
title:      "四级词汇-{letter}开头单词"
subtitle:   "四级词汇-{letter}开头单词"
date:       2025-02-11
author:     "vxiaozhi"
catalog: true
tags:
- english
- cet4
---

{{ for all word begin with letter}}
## word
{word.analysis}
{{end}}
"""
其中 word.analysis 通过读取 result/cet4/{letter}.json 获得,result/cet4/{letter}.json存储了{letter}开头的全部单词的信息,如果result/cet4/{letter}.json 不存在,则跳过该letter对应文件的生成。
更多约束如下:
1、2025-02-11-cet4-{letter}.md 保存到 result/cet4_articles 目录下。
2、Python 使用 3.8 版本。
3、假设所有Python依赖库已经安装。
© заявление об авторских правах

Похожие статьи

Нет комментариев

Вы должны войти в систему, чтобы участвовать в комментариях!
Войти сейчас
нет
Нет комментариев...