admin管理员组

文章数量:1037775

99行代码!教会你用Doris+DeepSeek实现AI舆情分析

你是否曾经历过这样的场景:公司号突然被喷,评论区一片狼藉,客服电话被打爆,老板紧急召集会议,大家手忙脚乱却不知从何入手? 舆情危机好比一场没有预警的暴风雨,瞬间就能让企业陷入困境。对处在风口浪尖的企业来说,拥有一套高效的舆情分析系统简直就是救命稻草。 正巧,一位Doris小伙伴:"WX!!! 急需AI舆情分析。" "好滴,安排"

舆情分析中的痛点

小华是某政务中心的舆情分析师,每天需要处理上千条网络评论。

传统的舆情分析流程繁琐又耗时:手动筛选关键信息,分析情绪趋势,生成报告,往往一天下来只能处理几百条数据。

"如果系统能自动识别高风险言论就好了,我也不用天天熬夜加班。"小华经常这样感叹。

张总是一家快消品企业的公关部负责人,公司刚上市新产品就遭遇了全网吐槽。面对铺天盖地的负面评论,张总的团队只能疲于奔命地一条条回复。

"我们需要知道舆情的源头在哪里,是质量问题还是营销策略出了错。可现在的分析速度远跟不上网络传播速度。"

......

Doris+DeepSeek:舆情分析的黄金组合

Apache Doris是一款基于 MPP 架构的高性能、实时分析型数据库,能够处理海量数据并提供毫秒级查询性能。

DeepSeek则是一款强大的大语言模型,拥有出色的语义理解和情感分析能力。

两者结合,好比给数据分析插上了AI的翅膀。

Doris负责数据存储和快速检索,DeepSeek负责深度解读文本背后的情感和意图。

这套组合的工作流程:

1️⃣ 数据采集:通过爬虫收集平台的评论和帖子等内容

2️⃣ 数据入库:将收集到的数据实时写入Doris

3️⃣ 大模型分析:DeepSeek对文本进行多维度分析

4️⃣ 可视化展示:将分析结果以直观的方式呈现

确认好组合思路,接下来就开始撕代码 ⬇️

99行代码速通AI舆情分析

环境准备

本文demo环境相对简易,参考DorisAi前文环境即可:

3步!教会你用Doris+DeepSeek搭建ChatBI系统(保姆级教程)

代码实现

经过一臻和老崔七七四十九秒的编写调试,完整的99行示例代码如下:

代码语言:javascript代码运行次数:0运行复制
import pymysql
from dbutils.pooled_db import PooledDB
import requests
from langchain.agents import initialize_agent, Tool
from langchain_openai import ChatOpenAI

"""
AI舆情分析|自动投诉处理系统 v1.0
Description: 基于LangChain Agent的智能流程自动化系统,替代硬编码方式处理投诉数据
"""

# 定义Apache Doris数据库查询的Agent Tool
def dorisTool(query):
    POOL_DORIS_OFF = PooledDB(
        user='{user}',password='{password}',host='{host}',port={port},database='{database}',
        charset='utf8',creator=pymysql,blocking=True,maxusage=None,setsession=[],maxconnections=30,mincached=10,ping=0,
    )
    cursor = POOL_DORIS_OFF.connection().cursor()
    cursor.execute(query)
    columns = [col[0] for col in cursor.description]
    rs = [dict(zip(columns, row)) for row in cursor.fetchall()]
    return rs

# 定义发送钉钉消息的Agent Tool
def dingdingTool(msg):
    markdown_message = f"""
           {msg}
           """
    webhook_url = (
        "{webhook_url}")
    headers = {'Content-Type': 'application/json'}
    payload = {
        "msgtype": "markdown",
        "markdown": {
            "title": "投诉数据明细",
            "text": markdown_message
        }
    }
    try:
        response = requests.post(webhook_url, headers=headers, json=payload)
        response.raise_for_status()
        print("钉钉消息推送成功")
    except requests.exceptions.RequestException as e:
        print(f"钉钉消息推送失败: {e}")

# 定义LangChain Agent工具列表
tools = [
    Tool(
        name="执行sql查询doris数据",
        func=dorisTool,
        description="根据传入的doris sql直接执行,返回结果集,返回格式为list"
    ),
    Tool(
        name="推送钉钉消息",
        func=dingdingTool,
        description="根据传入的msg通过钉钉机器人的形式推送msg到钉钉群"
    )
]

# 初始化LLM
llm = ChatOpenAI(base_url='',
                 api_key="{api_key}",
                 model='{model}')

# 初始化LangChain Agent
agent = initialize_agent(
    tools,
    llm,
    agent="zero-shot-react-description",
    verbose=True,
    handle_parsing_errors=True
)

# 提示模板,指导AI代理如何处理查询
question = "请问近30天有关于一臻数据的投诉信息吗"
promptTemplate = """
你是“一臻数据”平台的投诉识别以及处理员,需完成以下任务:
1. 根据用户的问题,生成一个 SQL 查询,具体查询时间范围以用用户实际问题为准。
2. 从查询结果中筛选出与“一臻数据”相关的投诉信息。
3. 将筛选结果汇总为易读的格式,并给出处理建议以及将命中的投诉信息根据你的建议排出一个紧急程度来,尽可能多的挖掘一些信息返回给客户,做专家指导,如“舆情分类”、“定义分类”、“紧急程度”等。
4. 如果存在与“一臻数据”相关的投诉,将汇总信息和你的处理建议通过钉钉机器人推送到指定群组。
5. 在推送内容中添加表情符号,增强可读性。
注意:
-如需调用工具,根据工具的作用在该任务里调用合适的工具,并根据工具的要求传入需要的参数,要求参数传入格式准确
-只能从获得的doris库中的数据中做分析,不允许自己fake数据。
数据库信息:
- 表名:yz_complaint_detail
- 字段:complaint_time(投诉时间), detail(具体投诉内容)
- SQL 查询示例:SELECT detail FROM yz_complaint_detail WHERE complaint_time >= NOW() - INTERVAL 60 DAY;
"""
prompt = f"{question}\n{promptTemplate}"

# 运行Agent
try:
    result = agent.run(prompt)
    print("Final Result:")
    print(result)
except Exception as e:
    print(f"代理执行出错: {e}")
代码解析

代码经过精简,很多block没有进行过多地细化深入。主要是为了让大家能够快速熟悉Doris+DeepSeek V3体验AI舆情分析的完整流程,后续可以结合自己需求,按模块进行调整应用。

代码主流程如下:

1️⃣ 用户查询:用户向系统提问,例如请问近30天有关于一臻数据的投诉信息吗

2️⃣ 任务分析:LangChain Agent接收问题和提示模板prompt,将其发送给大语言模型(DeepSeek V3)分析。语言模型理解问题意图,确定需要查询近30天的投诉数据

3️⃣ Doris数据库查询:Agent决定需要查询数据库,调用dorisTool函数,生成对应SQL进行查询并返回查询结果

4️⃣ 投诉分析:Agent将Doris查询结果发送给DeepSeek进行分析,DeepSeek筛选出与"一臻数据"相关的投诉,生成分析报告,包括舆情分类、紧急程度等信息

5️⃣ 结果处理:系统根据分析结果分两种情况处理:

无投诉:DeepSeek生成一个表明没有发现相关投诉的回复

有投诉:Agent调用dingdingTool函数,函数将分析报告格式化为Markdown,通过钉钉webhook发送到指定群组,返回发送状态给Agent

其它说明

1. 钉钉告警配置

99行代码!教会你用Doris+DeepSeek实现AI舆情分析

你是否曾经历过这样的场景:公司号突然被喷,评论区一片狼藉,客服电话被打爆,老板紧急召集会议,大家手忙脚乱却不知从何入手? 舆情危机好比一场没有预警的暴风雨,瞬间就能让企业陷入困境。对处在风口浪尖的企业来说,拥有一套高效的舆情分析系统简直就是救命稻草。 正巧,一位Doris小伙伴:"WX!!! 急需AI舆情分析。" "好滴,安排"

舆情分析中的痛点

小华是某政务中心的舆情分析师,每天需要处理上千条网络评论。

传统的舆情分析流程繁琐又耗时:手动筛选关键信息,分析情绪趋势,生成报告,往往一天下来只能处理几百条数据。

"如果系统能自动识别高风险言论就好了,我也不用天天熬夜加班。"小华经常这样感叹。

张总是一家快消品企业的公关部负责人,公司刚上市新产品就遭遇了全网吐槽。面对铺天盖地的负面评论,张总的团队只能疲于奔命地一条条回复。

"我们需要知道舆情的源头在哪里,是质量问题还是营销策略出了错。可现在的分析速度远跟不上网络传播速度。"

......

Doris+DeepSeek:舆情分析的黄金组合

Apache Doris是一款基于 MPP 架构的高性能、实时分析型数据库,能够处理海量数据并提供毫秒级查询性能。

DeepSeek则是一款强大的大语言模型,拥有出色的语义理解和情感分析能力。

两者结合,好比给数据分析插上了AI的翅膀。

Doris负责数据存储和快速检索,DeepSeek负责深度解读文本背后的情感和意图。

这套组合的工作流程:

1️⃣ 数据采集:通过爬虫收集平台的评论和帖子等内容

2️⃣ 数据入库:将收集到的数据实时写入Doris

3️⃣ 大模型分析:DeepSeek对文本进行多维度分析

4️⃣ 可视化展示:将分析结果以直观的方式呈现

确认好组合思路,接下来就开始撕代码 ⬇️

99行代码速通AI舆情分析

环境准备

本文demo环境相对简易,参考DorisAi前文环境即可:

3步!教会你用Doris+DeepSeek搭建ChatBI系统(保姆级教程)

代码实现

经过一臻和老崔七七四十九秒的编写调试,完整的99行示例代码如下:

代码语言:javascript代码运行次数:0运行复制
import pymysql
from dbutils.pooled_db import PooledDB
import requests
from langchain.agents import initialize_agent, Tool
from langchain_openai import ChatOpenAI

"""
AI舆情分析|自动投诉处理系统 v1.0
Description: 基于LangChain Agent的智能流程自动化系统,替代硬编码方式处理投诉数据
"""

# 定义Apache Doris数据库查询的Agent Tool
def dorisTool(query):
    POOL_DORIS_OFF = PooledDB(
        user='{user}',password='{password}',host='{host}',port={port},database='{database}',
        charset='utf8',creator=pymysql,blocking=True,maxusage=None,setsession=[],maxconnections=30,mincached=10,ping=0,
    )
    cursor = POOL_DORIS_OFF.connection().cursor()
    cursor.execute(query)
    columns = [col[0] for col in cursor.description]
    rs = [dict(zip(columns, row)) for row in cursor.fetchall()]
    return rs

# 定义发送钉钉消息的Agent Tool
def dingdingTool(msg):
    markdown_message = f"""
           {msg}
           """
    webhook_url = (
        "{webhook_url}")
    headers = {'Content-Type': 'application/json'}
    payload = {
        "msgtype": "markdown",
        "markdown": {
            "title": "投诉数据明细",
            "text": markdown_message
        }
    }
    try:
        response = requests.post(webhook_url, headers=headers, json=payload)
        response.raise_for_status()
        print("钉钉消息推送成功")
    except requests.exceptions.RequestException as e:
        print(f"钉钉消息推送失败: {e}")

# 定义LangChain Agent工具列表
tools = [
    Tool(
        name="执行sql查询doris数据",
        func=dorisTool,
        description="根据传入的doris sql直接执行,返回结果集,返回格式为list"
    ),
    Tool(
        name="推送钉钉消息",
        func=dingdingTool,
        description="根据传入的msg通过钉钉机器人的形式推送msg到钉钉群"
    )
]

# 初始化LLM
llm = ChatOpenAI(base_url='',
                 api_key="{api_key}",
                 model='{model}')

# 初始化LangChain Agent
agent = initialize_agent(
    tools,
    llm,
    agent="zero-shot-react-description",
    verbose=True,
    handle_parsing_errors=True
)

# 提示模板,指导AI代理如何处理查询
question = "请问近30天有关于一臻数据的投诉信息吗"
promptTemplate = """
你是“一臻数据”平台的投诉识别以及处理员,需完成以下任务:
1. 根据用户的问题,生成一个 SQL 查询,具体查询时间范围以用用户实际问题为准。
2. 从查询结果中筛选出与“一臻数据”相关的投诉信息。
3. 将筛选结果汇总为易读的格式,并给出处理建议以及将命中的投诉信息根据你的建议排出一个紧急程度来,尽可能多的挖掘一些信息返回给客户,做专家指导,如“舆情分类”、“定义分类”、“紧急程度”等。
4. 如果存在与“一臻数据”相关的投诉,将汇总信息和你的处理建议通过钉钉机器人推送到指定群组。
5. 在推送内容中添加表情符号,增强可读性。
注意:
-如需调用工具,根据工具的作用在该任务里调用合适的工具,并根据工具的要求传入需要的参数,要求参数传入格式准确
-只能从获得的doris库中的数据中做分析,不允许自己fake数据。
数据库信息:
- 表名:yz_complaint_detail
- 字段:complaint_time(投诉时间), detail(具体投诉内容)
- SQL 查询示例:SELECT detail FROM yz_complaint_detail WHERE complaint_time >= NOW() - INTERVAL 60 DAY;
"""
prompt = f"{question}\n{promptTemplate}"

# 运行Agent
try:
    result = agent.run(prompt)
    print("Final Result:")
    print(result)
except Exception as e:
    print(f"代理执行出错: {e}")
代码解析

代码经过精简,很多block没有进行过多地细化深入。主要是为了让大家能够快速熟悉Doris+DeepSeek V3体验AI舆情分析的完整流程,后续可以结合自己需求,按模块进行调整应用。

代码主流程如下:

1️⃣ 用户查询:用户向系统提问,例如请问近30天有关于一臻数据的投诉信息吗

2️⃣ 任务分析:LangChain Agent接收问题和提示模板prompt,将其发送给大语言模型(DeepSeek V3)分析。语言模型理解问题意图,确定需要查询近30天的投诉数据

3️⃣ Doris数据库查询:Agent决定需要查询数据库,调用dorisTool函数,生成对应SQL进行查询并返回查询结果

4️⃣ 投诉分析:Agent将Doris查询结果发送给DeepSeek进行分析,DeepSeek筛选出与"一臻数据"相关的投诉,生成分析报告,包括舆情分类、紧急程度等信息

5️⃣ 结果处理:系统根据分析结果分两种情况处理:

无投诉:DeepSeek生成一个表明没有发现相关投诉的回复

有投诉:Agent调用dingdingTool函数,函数将分析报告格式化为Markdown,通过钉钉webhook发送到指定群组,返回发送状态给Agent

其它说明

1. 钉钉告警配置

本文标签: 99行代码!教会你用DorisDeepSeek实现AI舆情分析