VBDeepSeek: инструмент с открытым исходным кодом для создания материалов для изучения слов в 4 классе с помощью DeepSeek
Общее введение
"Vocabulary Book by DeepSeek" - это проект с открытым исходным кодом, разработанный на основе большой модели DeepSeek и призванный помочь изучающим английский язык эффективно освоить лексику College English Level 4 (CET-4). Проект размещен на GitHub, создан разработчиком vxiaozhi. С помощью скрипта на Python в сочетании с мощными возможностями DeepSeek по генерации языка автоматически генерируются учебные материалы по лексике, содержащие значения слов, корневые слова, примеры предложений и техники запоминания. Инструмент упорядочивает слова в алфавитном порядке, имеет понятный формат вывода, поддерживает хранение файлов в формате JSON и подходит для студентов, преподавателей и самообучающихся. Код проекта открыт, и 80% или более автоматически генерируется DeepSeek, отражая инновационное применение ИИ в образовании. Готовитесь ли вы к четвертому классу или пополняете свой словарный запас, этот инструмент обеспечит удобную поддержку в обучении.

Список функций
- Автоматическое создание материалов для изучения лексики 4 класса: Вызывает интерфейс DeepSeek для создания значений слов, анализа корней, примеров предложений и подсказок для запоминания.
- Хранение по алфавиту: Разделите слова CET-4 на JSON-файлы от A до Z в соответствии с первой буквой, легко находить и управлять.
- Генерация полезных изображений: Создание мнемонических образов, связанных со словами, с помощью сценариев для улучшения запоминания.
- Генератор статей: Создавайте статьи для изучения лексики в формате Markdown, начинающиеся с буквы, подходящие для ведения блога или организации заметок.
- Поддержка открытых источников: Предоставляется полный код на языке Python, и пользователи могут свободно модифицировать или расширять функциональность.
Использование помощи
Процесс установки
"Vocabulary Book by DeepSeek" - это инструмент на основе Python, для запуска которого требуется определенная среда программирования. Ниже приведены подробные шаги по установке и использованию:
1. Подготовка окружающей среды
- Установка Python: Убедитесь, что в вашей системе установлен Python 3.8 или выше, который можно загрузить и установить с сайта Python.
- проект клонирования: Откройте терминал или командную строку и введите следующую команду, чтобы загрузить проект локально:
git clone https://github.com/vxiaozhi/vocabulary-book-by-deepseek.git cd vocabulary-book-by-deepseek
- Установка зависимостей: Проект полагается на несколько библиотек Python, выполните следующую команду для их установки:
pip install -r requirements.txt
если нет
requirements.txt
Библиотеку ядра можно установить вручную:pip install requests openai pillow
- Настройка API DeepSeek: Требуется ключ API DeepSeek. После регистрации учетной записи DeepSeek получите ключ в платформе DeepSeek и введите его в раздел вызова API в конфигурационном файле или коде проекта.
2. Использование основных функций
Проект состоит из двух основных скриптов: инструмента для создания слов и инструмента для создания изображений. Ниже приводится подробная схема работы:
(1) Создание материалов для изучения слов
- Подготовка словесных данных: Проекты предоставляются по умолчанию
data/cet4/
JSON-файлы, отсортированные по буквам A-Z в каталоге (например.A.json
, иB.json
). Каждый файл содержит список слов, начинающихся на соответствующую букву. - Выполнение сценариев::
- Откройте терминал и перейдите в каталог проекта.
- Выполните следующую команду, чтобы создать анализ слов:
python cet4_word_helper.py
- Скрипт прочитает
data/cet4/
Слова в списке используются для генерации значений слов, корней, примеров предложений и подсказок для запоминания через DeepSeek API, а результаты сохраняются вresult/cet4/
JSON-файл в каталоге (например.A.json
).
- Посмотреть результаты: Пример структуры сгенерированного JSON-файла:
{ "word": "abandon", "meaning": "放弃", "root": "a-(加强) + bandon(控制)", "example": "He had to abandon his car in the snow.", "memory_tip": "想象一个人在雪地里放弃aband控制on车。" }
(2) Создание мнемонических картинок
- Запустите сценарий создания изображения::
- Выполните следующую команду:
python gen_words_img.py
- Сценарии будут основаны на
result/cet4/
Данные слова в скрипте используются для создания мнемонических изображений, которые по умолчанию сохраняются в указанную директорию (вам необходимо настроить путь вывода в скрипте).
- Выполните следующую команду:
- Пользовательские настройки: Модификация
gen_words_img.py
параметры, такие как размер, разрешение или стиль изображения, чтобы гарантировать, что будут созданы изображения, соответствующие требованиям.
(3) Создание словарных статей
- Запустите сценарий создания статьи::
- Реализация:
python gen_articles.py
- Чтение сценария
result/cet4/
в JSON-файле, генерируя 26 Markdown-файлов (таких как2025-02-11-cet4-A.md
), сохраните вresult/cet4_articles/
Каталог.
- Реализация:
- формат вывода: Каждый файл содержит анализ слов, начинающихся с букв, подходящий для изучения или совместного использования. Пример:
--- title: "四级词汇-A开头单词" date: 2025-02-11 --- ## abandon 词义:放弃 词根:a-(加强) + bandon(控制) 例句:He had to abandon his car in the snow. 记忆技巧:想象一个人在雪地里放弃aband控制on车。
3. оперативные соображения
- Безопасность ключей API: Не вводите ключи API DeepSeek непосредственно в скрипты, рекомендуется использовать переменные окружения для их хранения:
export DEEPSEEK_API_KEY='你的密钥'
- сетевое подключение: Убедитесь, что сеть свободна при запуске сценария, так как он использует API DeepSeek.
- Проверка пути к файлуЕсли
data/cet4/
возможноresult/cet4/
Директория отсутствует, необходимо вручную создать или настроить путь к сценарию. - Расширенная функциональность: Код может быть изменен по мере необходимости, например, для добавления поддержки слов 6-го уровня или изменения формата вывода.
4. Эксплуатация специальных функций
- пакетный файл: Генерируйте профили слов для всех букв сразу, запуская основной скрипт только один раз.
- Память с картинкамиСозданные вспомогательные изображения можно импортировать в электронные конспекты или распечатать, чтобы дополнить текстовое обучение.
- Совместное использование статейФайлы Markdown можно использовать непосредственно для публикации в блоге или импортировать в такие инструменты, как Notion, для организации учебных заметок.
Миссия Клайн
Задание1
用 Python 写一个 cet4 单词助记工具,对单词进行词义词根分析、例举例句、并提供一些高效的记忆技巧和窍门。 详细需求如下:
1. 单词已经按照字母归类存储在data/cet4/目录下,分别为: A.json B.json ... Z.json
2. 读取每一个 data/cet4/目录下 每个JSON文件中的所有单词,对每个单词调用OpenAI的接口生成该单词的词义、词根、例句、记忆技巧信息。
3. 生成的单词信息保存到 result/cet4/目录下,分别为: A.json B.json ... Z.json
Задача2
用 Python3.8 写一个单词助记图片生成工具gen_words_img.py, 详细需求如下:
1. 读取每一个 result/cet4/目录下 每个JSON文件中的所有单词信息,每个单词信息包括word、analysis、draw_explain、draw_prompt 4个字段。
2. 对每个单词调用replicate的接口(接口具体实现在provider_replicate.py:replicate_run)生成该单词的图片。
3. 生成的图片文件保存到 result/cet4_imgs/目录下,文件名称格式为:{first_letter_of_word}/{word}.jpg。如果对应图片文件已存在,则跳过本图片文件的生成。
4. 假设所有依赖库已经安装。
Задание3
用 Python3.8 写一个文章生成工具gen_articles.py, 为26个英文字母各生成一个文件,共26个文件,文件名格式为:2025-02-11-cet4-{letter}.md, 每个文件的内容组成如下:
"""
---
layout: post
title: "四级词汇-{letter}开头单词"
subtitle: "四级词汇-{letter}开头单词"
date: 2025-02-11
author: "vxiaozhi"
catalog: true
tags:
- english
- cet4
---
{{ for all word begin with letter}}
## word
{word.analysis}
{{end}}
"""
其中 word.analysis 通过读取 result/cet4/{letter}.json 获得,result/cet4/{letter}.json存储了{letter}开头的全部单词的信息,如果result/cet4/{letter}.json 不存在,则跳过该letter对应文件的生成。
更多约束如下:
1、2025-02-11-cet4-{letter}.md 保存到 result/cet4_articles 目录下。
2、Python 使用 3.8 版本。
3、假设所有Python依赖库已经安装。
© заявление об авторских правах
Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.
Похожие статьи
Нет комментариев...