type
status
date
slug
summary
tags
category
icon
password
ES 数据的 content 字段是 html 格式的内容,现在想用纯文本内容代替 html。
方案一
用 ES reindex API 的 script 功能去除 html 标签。
发现去掉了很多原文内容,舍弃。
方案二
从原始数据库查询 content 字段的各个部分(text 版本的 content 被分成了 section_1, section_2, section_3)并更新 ES 的 content 字段。
logstash 配置文件: <u>update-content.conf</u>
运行 logstash