在 obsidian 中预览 word 的 docx 文件,并且可以将其转换为 markdown 笔记
docx 转 md 可以将文字和图片正确转换,可以保留加粗,斜体,表格等样式,但会丢失如文字颜色,文字背景等样式
这是一个从 https://pkmer.cn/pkmer-docs/10-obsidian/obsidian%e7%a4%be%e5%8c%ba%e6%8f%92%e4%bb%b6/docxer 下的原始话题分离的讨论话题
在 obsidian 中预览 word 的 docx 文件,并且可以将其转换为 markdown 笔记
docx 转 md 可以将文字和图片正确转换,可以保留加粗,斜体,表格等样式,但会丢失如文字颜色,文字背景等样式
这个转换以后文件里的图片丢失了,是怎么回事?
一个可能原因是, 插件有个把 docx 里图片 alt 名称转合法文件名的逻辑
function toValidFilename(filename2) {
let validFilename = filename2.replace(/[^a-zA-Z0-9öüäÖÜÄ.\-]/g, "");
return validFilename;
}
于是当 docx 里图片 alt 名称是中文时, 只能转出来一个 .png
就挂了
简单的解决方案是, 在 docx 里, 把每张图都给加上 “数字英文 alt 名”, 方法: Word → 图片右键 → 查看可选替换文字 → 给每张图写点不一样的 “替换文字”
我自己这样做后, 可以正常转换 md + 大量附件图
(不排除可能还有其他的问题)
为什么安装并更改设置后还是打不开docx文件?一直显示fail to open
只有 fail to open 不好猜出来
这得看更详尽的报错, 考虑打开控制台 Ctrl+Shift+i
看看具体写的啥
另外可以先造个简单 docx, 写两句话, 不要图, 不要复杂格式, 放进去看看能否打开
打开docx文件,识别不了公式,是哪里没设置好?还是目前无法识别正确格式?
看来不太像设置能解决的
docxer 依赖一个 docx to HTML 的工具库 mammoth.js
但是这个库似乎不支持识别 word 文档里的公式标记
Supporting math · Issue #83 · mwilliamson/mammoth.js
如果文档里有许多公式, 替代办法是找那种 “在线转换 Word to md 的网站”