99行代码！教会你用Doris+DeepSeek实现AI舆情分析-369IT编程

admin管理员组
文章数量:1037775

99行代码！教会你用Doris+DeepSeek实现AI舆情分析

❝你是否曾经历过这样的场景：公司号突然被喷，评论区一片狼藉，客服电话被打爆，老板紧急召集会议，大家手忙脚乱却不知从何入手？舆情危机好比一场没有预警的暴风雨，瞬间就能让企业陷入困境。对处在风口浪尖的企业来说，拥有一套高效的舆情分析系统简直就是救命稻草。正巧，一位Doris小伙伴："WX!!! 急需AI舆情分析。" "好滴，安排"

舆情分析中的痛点

小华是某政务中心的舆情分析师，每天需要处理上千条网络评论。

传统的舆情分析流程繁琐又耗时：手动筛选关键信息，分析情绪趋势，生成报告，往往一天下来只能处理几百条数据。

"如果系统能自动识别高风险言论就好了，我也不用天天熬夜加班。"小华经常这样感叹。

张总是一家快消品企业的公关部负责人，公司刚上市新产品就遭遇了全网吐槽。面对铺天盖地的负面评论，张总的团队只能疲于奔命地一条条回复。

"我们需要知道舆情的源头在哪里，是质量问题还是营销策略出了错。可现在的分析速度远跟不上网络传播速度。"

......

Doris+DeepSeek：舆情分析的黄金组合

Apache Doris是一款基于 MPP 架构的高性能、实时分析型数据库，能够处理海量数据并提供毫秒级查询性能。

DeepSeek则是一款强大的大语言模型，拥有出色的语义理解和情感分析能力。

两者结合，好比给数据分析插上了AI的翅膀。

Doris负责数据存储和快速检索，DeepSeek负责深度解读文本背后的情感和意图。

这套组合的工作流程：

1️⃣ 数据采集：通过爬虫收集平台的评论和帖子等内容

2️⃣ 数据入库：将收集到的数据实时写入Doris

3️⃣ 大模型分析：DeepSeek对文本进行多维度分析

4️⃣ 可视化展示：将分析结果以直观的方式呈现

确认好组合思路，接下来就开始撕代码 ⬇️

99行代码速通AI舆情分析

环境准备

本文demo环境相对简易，参考DorisAi前文环境即可：

3步！教会你用Doris+DeepSeek搭建ChatBI系统（保姆级教程）

代码实现

经过一臻和老崔七七四十九秒的编写调试，完整的99行示例代码如下：

代码语言：javascript代码运行次数：0运行复制

import pymysql
from dbutils.pooled_db import PooledDB
import requests
from langchain.agents import initialize_agent, Tool
from langchain_openai import ChatOpenAI

"""
AI舆情分析｜自动投诉处理系统 v1.0
Description: 基于LangChain Agent的智能流程自动化系统，替代硬编码方式处理投诉数据
"""

# 定义Apache Doris数据库查询的Agent Tool
def dorisTool(query):
    POOL_DORIS_OFF = PooledDB(
        user='{user}',password='{password}',host='{host}',port={port},database='{database}',
        charset='utf8',creator=pymysql,blocking=True,maxusage=None,setsession=[],maxconnections=30,mincached=10,ping=0,
    )
    cursor = POOL_DORIS_OFF.connection().cursor()
    cursor.execute(query)
    columns = [col[0] for col in cursor.description]
    rs = [dict(zip(columns, row)) for row in cursor.fetchall()]
    return rs

# 定义发送钉钉消息的Agent Tool
def dingdingTool(msg):
    markdown_message = f"""
           {msg}
           """
    webhook_url = (
        "{webhook_url}")
    headers = {'Content-Type': 'application/json'}
    payload = {
        "msgtype": "markdown",
        "markdown": {
            "title": "投诉数据明细",
            "text": markdown_message
        }
    }
    try:
        response = requests.post(webhook_url, headers=headers, json=payload)
        response.raise_for_status()
        print("钉钉消息推送成功")
    except requests.exceptions.RequestException as e:
        print(f"钉钉消息推送失败: {e}")

# 定义LangChain Agent工具列表
tools = [
    Tool(
        name="执行sql查询doris数据",
        func=dorisTool,
        description="根据传入的doris sql直接执行，返回结果集，返回格式为list"
    ),
    Tool(
        name="推送钉钉消息",
        func=dingdingTool,
        description="根据传入的msg通过钉钉机器人的形式推送msg到钉钉群"
    )
]

# 初始化LLM
llm = ChatOpenAI(base_url='',
                 api_key="{api_key}",
                 model='{model}')

# 初始化LangChain Agent
agent = initialize_agent(
    tools,
    llm,
    agent="zero-shot-react-description",
    verbose=True,
    handle_parsing_errors=True
)

# 提示模板，指导AI代理如何处理查询
question = "请问近30天有关于一臻数据的投诉信息吗"
promptTemplate = """
你是“一臻数据”平台的投诉识别以及处理员，需完成以下任务：
1. 根据用户的问题，生成一个 SQL 查询，具体查询时间范围以用用户实际问题为准。
2. 从查询结果中筛选出与“一臻数据”相关的投诉信息。
3. 将筛选结果汇总为易读的格式，并给出处理建议以及将命中的投诉信息根据你的建议排出一个紧急程度来，尽可能多的挖掘一些信息返回给客户，做专家指导，如“舆情分类”、“定义分类”、“紧急程度”等。
4. 如果存在与“一臻数据”相关的投诉，将汇总信息和你的处理建议通过钉钉机器人推送到指定群组。
5. 在推送内容中添加表情符号，增强可读性。
注意：
-如需调用工具，根据工具的作用在该任务里调用合适的工具，并根据工具的要求传入需要的参数，要求参数传入格式准确
-只能从获得的doris库中的数据中做分析，不允许自己fake数据。
数据库信息：
- 表名：yz_complaint_detail
- 字段：complaint_time（投诉时间）, detail（具体投诉内容）
- SQL 查询示例：SELECT detail FROM yz_complaint_detail WHERE complaint_time >= NOW() - INTERVAL 60 DAY;
"""
prompt = f"{question}\n{promptTemplate}"

# 运行Agent
try:
    result = agent.run(prompt)
    print("Final Result:")
    print(result)
except Exception as e:
    print(f"代理执行出错: {e}")

代码解析

代码经过精简，很多block没有进行过多地细化深入。主要是为了让大家能够快速熟悉Doris+DeepSeek V3体验AI舆情分析的完整流程，后续可以结合自己需求，按模块进行调整应用。

代码主流程如下：

1️⃣ 用户查询：用户向系统提问，例如请问近30天有关于一臻数据的投诉信息吗

2️⃣ 任务分析：LangChain Agent接收问题和提示模板prompt，将其发送给大语言模型（DeepSeek V3）分析。语言模型理解问题意图，确定需要查询近30天的投诉数据

3️⃣ Doris数据库查询：Agent决定需要查询数据库，调用dorisTool函数，生成对应SQL进行查询并返回查询结果

4️⃣ 投诉分析：Agent将Doris查询结果发送给DeepSeek进行分析，DeepSeek筛选出与"一臻数据"相关的投诉，生成分析报告，包括舆情分类、紧急程度等信息

5️⃣ 结果处理：系统根据分析结果分两种情况处理：

无投诉：DeepSeek生成一个表明没有发现相关投诉的回复

有投诉：Agent调用dingdingTool函数，函数将分析报告格式化为Markdown，通过钉钉webhook发送到指定群组，返回发送状态给Agent

其它说明

1. 钉钉告警配置

99行代码！教会你用Doris+DeepSeek实现AI舆情分析

舆情分析中的痛点

小华是某政务中心的舆情分析师，每天需要处理上千条网络评论。

传统的舆情分析流程繁琐又耗时：手动筛选关键信息，分析情绪趋势，生成报告，往往一天下来只能处理几百条数据。

"如果系统能自动识别高风险言论就好了，我也不用天天熬夜加班。"小华经常这样感叹。

张总是一家快消品企业的公关部负责人，公司刚上市新产品就遭遇了全网吐槽。面对铺天盖地的负面评论，张总的团队只能疲于奔命地一条条回复。

"我们需要知道舆情的源头在哪里，是质量问题还是营销策略出了错。可现在的分析速度远跟不上网络传播速度。"

......

Doris+DeepSeek：舆情分析的黄金组合

Apache Doris是一款基于 MPP 架构的高性能、实时分析型数据库，能够处理海量数据并提供毫秒级查询性能。

DeepSeek则是一款强大的大语言模型，拥有出色的语义理解和情感分析能力。

两者结合，好比给数据分析插上了AI的翅膀。

Doris负责数据存储和快速检索，DeepSeek负责深度解读文本背后的情感和意图。

这套组合的工作流程：

1️⃣ 数据采集：通过爬虫收集平台的评论和帖子等内容

2️⃣ 数据入库：将收集到的数据实时写入Doris

3️⃣ 大模型分析：DeepSeek对文本进行多维度分析

4️⃣ 可视化展示：将分析结果以直观的方式呈现

确认好组合思路，接下来就开始撕代码 ⬇️

99行代码速通AI舆情分析

环境准备

本文demo环境相对简易，参考DorisAi前文环境即可：

3步！教会你用Doris+DeepSeek搭建ChatBI系统（保姆级教程）

代码实现

经过一臻和老崔七七四十九秒的编写调试，完整的99行示例代码如下：

代码语言：javascript代码运行次数：0运行复制

import pymysql
from dbutils.pooled_db import PooledDB
import requests
from langchain.agents import initialize_agent, Tool
from langchain_openai import ChatOpenAI

"""
AI舆情分析｜自动投诉处理系统 v1.0
Description: 基于LangChain Agent的智能流程自动化系统，替代硬编码方式处理投诉数据
"""

# 定义Apache Doris数据库查询的Agent Tool
def dorisTool(query):
    POOL_DORIS_OFF = PooledDB(
        user='{user}',password='{password}',host='{host}',port={port},database='{database}',
        charset='utf8',creator=pymysql,blocking=True,maxusage=None,setsession=[],maxconnections=30,mincached=10,ping=0,
    )
    cursor = POOL_DORIS_OFF.connection().cursor()
    cursor.execute(query)
    columns = [col[0] for col in cursor.description]
    rs = [dict(zip(columns, row)) for row in cursor.fetchall()]
    return rs

# 定义发送钉钉消息的Agent Tool
def dingdingTool(msg):
    markdown_message = f"""
           {msg}
           """
    webhook_url = (
        "{webhook_url}")
    headers = {'Content-Type': 'application/json'}
    payload = {
        "msgtype": "markdown",
        "markdown": {
            "title": "投诉数据明细",
            "text": markdown_message
        }
    }
    try:
        response = requests.post(webhook_url, headers=headers, json=payload)
        response.raise_for_status()
        print("钉钉消息推送成功")
    except requests.exceptions.RequestException as e:
        print(f"钉钉消息推送失败: {e}")

# 定义LangChain Agent工具列表
tools = [
    Tool(
        name="执行sql查询doris数据",
        func=dorisTool,
        description="根据传入的doris sql直接执行，返回结果集，返回格式为list"
    ),
    Tool(
        name="推送钉钉消息",
        func=dingdingTool,
        description="根据传入的msg通过钉钉机器人的形式推送msg到钉钉群"
    )
]

# 初始化LLM
llm = ChatOpenAI(base_url='',
                 api_key="{api_key}",
                 model='{model}')

# 初始化LangChain Agent
agent = initialize_agent(
    tools,
    llm,
    agent="zero-shot-react-description",
    verbose=True,
    handle_parsing_errors=True
)

# 提示模板，指导AI代理如何处理查询
question = "请问近30天有关于一臻数据的投诉信息吗"
promptTemplate = """
你是“一臻数据”平台的投诉识别以及处理员，需完成以下任务：
1. 根据用户的问题，生成一个 SQL 查询，具体查询时间范围以用用户实际问题为准。
2. 从查询结果中筛选出与“一臻数据”相关的投诉信息。
3. 将筛选结果汇总为易读的格式，并给出处理建议以及将命中的投诉信息根据你的建议排出一个紧急程度来，尽可能多的挖掘一些信息返回给客户，做专家指导，如“舆情分类”、“定义分类”、“紧急程度”等。
4. 如果存在与“一臻数据”相关的投诉，将汇总信息和你的处理建议通过钉钉机器人推送到指定群组。
5. 在推送内容中添加表情符号，增强可读性。
注意：
-如需调用工具，根据工具的作用在该任务里调用合适的工具，并根据工具的要求传入需要的参数，要求参数传入格式准确
-只能从获得的doris库中的数据中做分析，不允许自己fake数据。
数据库信息：
- 表名：yz_complaint_detail
- 字段：complaint_time（投诉时间）, detail（具体投诉内容）
- SQL 查询示例：SELECT detail FROM yz_complaint_detail WHERE complaint_time >= NOW() - INTERVAL 60 DAY;
"""
prompt = f"{question}\n{promptTemplate}"

# 运行Agent
try:
    result = agent.run(prompt)
    print("Final Result:")
    print(result)
except Exception as e:
    print(f"代理执行出错: {e}")

代码解析

代码主流程如下：

1️⃣ 用户查询：用户向系统提问，例如请问近30天有关于一臻数据的投诉信息吗

3️⃣ Doris数据库查询：Agent决定需要查询数据库，调用dorisTool函数，生成对应SQL进行查询并返回查询结果

4️⃣ 投诉分析：Agent将Doris查询结果发送给DeepSeek进行分析，DeepSeek筛选出与"一臻数据"相关的投诉，生成分析报告，包括舆情分类、紧急程度等信息

5️⃣ 结果处理：系统根据分析结果分两种情况处理：

无投诉：DeepSeek生成一个表明没有发现相关投诉的回复

有投诉：Agent调用dingdingTool函数，函数将分析报告格式化为Markdown，通过钉钉webhook发送到指定群组，返回发送状态给Agent

其它说明

1. 钉钉告警配置

本文标签： 99行代码！教会你用DorisDeepSeek实现AI舆情分析

版权声明：本文标题：99行代码！教会你用Doris+DeepSeek实现AI舆情分析内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：http://it.en369.cn/jiaocheng/1748332277a2286766.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

369IT编程

99行代码！教会你用Doris+DeepSeek实现AI舆情分析

99行代码！教会你用Doris+DeepSeek实现AI舆情分析

舆情分析中的痛点

Doris+DeepSeek：舆情分析的黄金组合

99行代码速通AI舆情分析

环境准备

代码实现

代码解析

其它说明

99行代码！教会你用Doris+DeepSeek实现AI舆情分析

舆情分析中的痛点

Doris+DeepSeek：舆情分析的黄金组合

99行代码速通AI舆情分析

环境准备

代码实现

代码解析

其它说明

更多相关文章

99行代码！教会你用Doris+DeepSeek实现AI舆情分析

发表评论

推荐文章

【HarmonyOS Next之旅】DevEco Studio使用指南(十)

word如何加目录、图标题目录、表标题目录

我“AI”发文——OpenAI最新研究成果解析

DeepSeek+即梦AI：零基础也能轻松制作哪吒动画手办图，超详细教程！

【redis】string类型相关操作：SET、GET、MSET、MGET、SETNX、SETEX、PSETEX

热门文章

大模型背景下智能体、工具、函数和MCP傻傻分不清？

HarmonyOS 5.0.4 Release API16发布

SQL优化技术分享：从 321 秒到 0.2 秒的性能飞跃 —— 基于 PawSQL 的 TPCH 查询优化实战

Suno API: Empowering AI Music Creation – A Comprehensive Overview

Trae 开发工具与使用技巧

CentOS+Redmine：5步搭建企业级项目管理系统，告别项目混乱！

【重磅】为本地部署DeepSeek插上联网的翅膀，这个方案已被官方认证！

全面剖析 Linux 进程管理与 PCB 机制

golang之旅——Go Module

如何在Spring Boot中实现数据加密

最新文章

LLM学习笔记：如何理解LLM中的Transformer架构

o3 deep research: 智能体的应用和演进

从开发者视角洞见未来，找到自己的破局之道：Deepseek和Manus如何助力破局？

嵌入式Linux：阻塞式IO与非阻塞式IO

STM32如何精准控制步进电机？

程序员刚毕业，先去大厂镀金还是先去小厂攒经验？

万象2008清空boss账户密码

【Tools】GitBook简明教程

oracle exadata celldisk 闪存盘受损导致性能下降

SDUT 2138 图结构练习——BFSDFS——判断可达性

How to vary WooCommerce product prices based on order dates

For a menu custom link (without a link) a &quot;#&quot; is appended. Can this just be blank, i.e. NO link?

multisite - Hook into &#39;admin_url&#39; but only on Mysites admin bar menu

Global login to password protected pages

having a page in multi sub-menu and match current-menu-item

For a menu custom link (without a link) a "#" is appended. Can this just be blank, i.e. NO link?

multisite - Hook into 'admin_url' but only on Mysites admin bar menu