Releases: H1DDENADM1N/ECCEDICT
ECCEDICT - 5
❓ ECCEDICT 是由 ECDICT mdx格式 CSS定制版 衍生而来,使用新工具 eccedict.py 重构的支持英汉汉英双向查询的字典。并且从《精装牛津十》增加 160435 条 英、美 音标,从 qwerty-learner 更新了 12365 条标签(中高研四六托雅宝)
🆕 更新内容
Feat: 更新了 12365 条标签(中高研四六托雅宝) a534cf4
- 标签数据收集自 qwerty-learner
🛠️ 构建说明
展开
概述
本流程用于构建一个增强版的英汉词典 concise-enhanced.mdx
,支持英汉汉英反查,并包含丰富的标签和音标信息。整个流程分为多个步骤,涉及多个工具和数据源。
工具与依赖
-
Python 脚本:
- eccedict.py:主脚本,用于生成词典数据库和最终 MDX 文件。
- 依赖库:
beautifulsoup4
,loguru
,duckdb
。
-
外部工具:
- writemdict:用于生成 MDX 文件。
- AutoMdxBuilder:用于解包 MDX 文件。
-
GoldenDict:
- GoldenDict-ng:用于查看生成的 MDX 文件。
数据源
-
基础词典数据:
- stardict.7z:解压后得到
stardict.csv
,作为基础词典数据。
- stardict.7z:解压后得到
-
标签数据:
- qwerty-learner:通过
git clone
获取.\qwerty-learner\
文件夹,需要用的文件夹内的部分json数据,用于生成tag.ddb
。标签 数据来源 单词数量 中 ZhongKaoHeXin.json 2140 高 GaoKao_3500.json 3877 四 CET4_T.json 2607 六 CET6_T.json 2345 研 KaoYan_2024.json + 2025KaoYanHongBaoShu.json 7640 托 TOEFL_3_T.json 4264 雅 IELTS_3_T.json 3575 宝 GRE3000_3_T.json 3036
- qwerty-learner:通过
-
音标数据:
- oald-fork.mdx:使用
AutoMdxBuilder
解包得到.\oald-fork\oald-fork.txt
,用于生成phonetics.ddb
。
- oald-fork.mdx:使用
构建步骤( eccedict.py 作用简述)
-
初始化:
- 配置日志系统。
- 创建输出目录并定义文件路径。
- 检查源文件和工具是否存在。
-
生成基础数据库:
- 将
stardict.csv
转换为stardict.ddb
。
- 将
-
生成标签数据库:
- 从
qwerty-learner
中提取标签数据,生成tag.ddb
。
- 从
-
更新标签信息:
- 将
tag.ddb
中的标签信息更新到stardict.ddb
。
- 将
-
生成音标数据库:
- 从
oald-fork.txt
中提取音标数据,生成phonetics.ddb
。
- 从
-
更新音标信息:
- 将
phonetics.ddb
中的音标信息更新到stardict.ddb
。
- 将
-
生成文本文件:
- 将更新后的
stardict.ddb
转换为stardict.txt
。
- 将更新后的
-
生成 MDX 文件:
- 使用
stardict.txt
生成最终的concise-enhanced.mdx
。
- 使用
-
打开 GoldenDict:
- 自动打开 GoldenDict 并重建索引。
输出文件
stardict.ddb
:更新后的词典数据库文件。tag.ddb
:标签数据库文件。phonetics.ddb
:音标数据库文件。stardict.txt
:中间文本文件。concise-enhanced.mdx
:最终生成的 MDX 词典文件。
总耗时
整个流程预计耗时约 2 小时,具体时间取决于硬件性能和文件大小。
注意事项
- 确保所有依赖工具和数据源已正确安装和配置。
- 在运行脚本前,检查所有路径和文件是否存在,避免因文件缺失导致流程中断。
- 生成的 MDX 文件可通过 GoldenDict-ng 查看和使用。
通过以上步骤,您可以成功构建一个功能丰富的英汉词典,支持标签和音标信息,并可在 GoldenDict-ng 中使用。
🥰 成品下载
ECCEDICT.7z
123盘:https://www.123684.com/s/qBxUVv-p9Vq3 提取码: vtkx
#️⃣ SHA-1 47203ed4172bb5a8345a6e92ae26be1f33033a94
🖼️ 英美音标效果图
🖼️ 反查效果图
ECCEDICT - 4
❓ ECCEDICT 是由 ECDICT mdx格式 CSS定制版 衍生而来,使用新工具 eccedict.py 重构的支持英汉汉英双向查询的字典
🆕 更新内容
Feat: 增加 160435 条 英、美 音标 34def1b
- 仅在英国和美国发音不同时区分显示音标
- 从《精装牛津十》(OALD) 抓取的音标数据
- 添加日志记录以跟踪关键操作
- 实施性能计时以测量执行时间
- 在
concise-enhanced.css
将音标字体改为了牛津十同款
🛠️ 构建说明
展开
eccedict.py (使用 beautifulsoup4 loguru duckdb 重构的字典生成工具,另需要writemdict 和 AutoMdxBuilder)
➕
stardict.csv (解压自 stardict.7z)
⬇️
stardict.ddb (DuckDB数据库文件 原始版本)
oald-fork.mdx 用 AutoMdxBuilder 解包获得 .\oald-fork\oald-fork.txt
oald-fork.txt
⬇️
phonetics.ddb(DuckDB数据库文件 存储的是单词和对应英音音标和美音音标)
⬇️
stardict.ddb (DuckDB数据库文件 更新了音标的版本)
⬇️
stardict.txt (一词一行html)
⬇️
concise-enhanced.mdx (CSS定制且支持英汉汉英反查的mdx字典,使用goldendict-ng)
⬇️
ECCEDICT.7z (concise-enhanced.mdx + concise-enhanced.css + concise-enhanced.png)
🥰 成品下载
ECCEDICT.7z
123盘:https://www.123684.com/s/qBxUVv-p9Vq3 提取码: vtkx
#️⃣ SHA-1 315c05e05d9768f9d23df10f4005bc35b91de41a
🖼️ 英美音标效果图
🖼️ 反查效果图
ECCEDICT - 3
❓ ECCEDICT 是由 ECDICT mdx格式 CSS定制版 衍生而来,使用新工具 eccedict.py 重构的支持英汉汉英双向查询的字典
🆕 更新内容
Fix 无翻译时不显示英文原文
Fix [网络] 来源的翻译配色无效
🛠️ 构建说明
eccedict.py (使用 beautifulsoup4 loguru duckdb 重构的字典生成工具,另需要writemdict)
➕
stardict.csv (解压自 stardict.7z)
⬇️
stardict.ddb (DuckDB数据库文件)
⬇️
stardict.txt (一词一行html)
⬇️
concise-enhanced.mdx (CSS定制且支持英汉汉英反查的mdx字典,使用goldendict-ng)
⬇️
ECCEDICT.7z (concise-enhanced.mdx + concise-enhanced.css + concise-enhanced.png)
🥰 成品下载
ECCEDICT.7z
123盘:https://www.123684.com/s/qBxUVv-p9Vq3 提取码: vtkx (放在旧版文件夹里了)
#️⃣ SHA-1 d9275cab13e67b3e9283f1ce60f4b9fca4fbc738
🖼️ 反查效果图
ECCEDICT - 2
❓ ECCEDICT 是由 ECDICT mdx格式 CSS定制版 衍生而来,使用新工具 eccedict.py 重构的支持英汉汉英双向查询的字典
🆕 更新内容
Fix 词性后是换行未正确匹配,缺失高亮
Fix 部分汉英转换结果错误地覆盖了英汉结果
Fix convert_csv_to_duckdb() 调用参数错误
Fix raise Error 未字符串化
🛠️ 构建说明
eccedict.py (使用 beautifulsoup4 loguru duckdb 重构的字典生成工具,另需要writemdict)
➕
stardict.csv (解压自 stardict.7z)
⬇️
stardict.ddb (DuckDB数据库文件)
⬇️
stardict.txt (一词一行html)
⬇️
concise-enhanced.mdx (CSS定制且支持英汉汉英反查的mdx字典,使用goldendict-ng)
⬇️
ECCEDICT.7z (concise-enhanced.mdx + concise-enhanced.css + concise-enhanced.png)
🥰 成品下载
无
🖼️ 反查效果图
ECCEDICT - 1
eccedict.py (使用 beautifulsoup4 loguru duckdb 重构的字典生成工具,另需要writemdict)
stardict.csv (解压自 stardict.7z) -> stardict.ddb (DuckDB数据库文件)-> stardict.txt (一词一行html) -> concise-enhanced.mdx (CSS定制且支持英汉汉英反查的mdx字典,使用goldendict-ng)-> ECCEDICT.7z (concise-enhanced.mdx + concise-enhanced.css + concise-enhanced.png)