logstash 拼接字段
2023-7-19
| 2024-9-29
0  |  Read Time 0 min
type
status
date
slug
summary
tags
category
icon
password
 
ES 数据的 content 字段是 html 格式的内容,现在想用纯文本内容代替 html。
 

方案一

用 ES reindex API 的 script 功能去除 html 标签。
发现去掉了很多原文内容,舍弃。
 

方案二

从原始数据库查询 content 字段的各个部分(text 版本的 content 被分成了 section_1, section_2, section_3)并更新 ES 的 content 字段。
logstash 配置文件: <u>update-content.conf</u>
运行 logstash
  • logstash
  • Milvus 安装 - Docker GPU 版logstash 导出 ES 数据到 csv 文件
    Loading...