佛山家具选购经验

发表于 2025-08-18 分类于生活
本文字数： 2.3k 阅读时长 ≈ 8 分钟

佛山家具大体介绍

家具大部分都在顺德区。除了几个家居商城，厂家都比较分散，小红书上广告比较多的店，从最北边到最南边要开上30分钟的车。

商场
- 罗浮宫：里面的东西都比较贵，有时间可以去看看，没时间就不用去了
- 顺联北：价格中等。但你自己去逛一般也逛不出什么名堂
- 乐从国际家私城：低端家具。我在桔子酒店住的时候，第二天退房就有工作人员忽悠我去这里，说120可以包一天车，听起来很划算，但我觉得他肯定会想办法拉你去他合作的店来抽成，别贪小便宜。
小红书上比较有名的厂家
太多了不一一列举。这些厂家也大体可以分为中端、中高端，高端。高端我没看，中高端的比如观山，众观，博领，摩登翡丽。中高端比平价能贵出1-2倍。

攻略

行程安排

不论你的预算是多少，我都建议你第一天先去看看比你预算高一档的厂，感受一下更好的货的价格，做工和坐感。
第二天再去你目标价位的厂和比你目标价位更低的厂去看，看看价格相差多少，品质相差多少。

找店一定要先确定店的主营风格，很少有全部风格全都做的，风格不对去了也白去。

除了罗浮宫的进口观需要预约（很麻烦），商场可以直接去。
大部分厂家的直营店去看的话是要预约的。当天预约也行，从小红书找他们账号联系。主要是有的地方没人接待你上都上不去。
不同的获客渠道会给你报不同的价格，这里面门道我还没有摸得太清楚。但我觉得只要有中介就会有抽成，所以不要通过第三方去联系，从小红书直接联系应该是能获得较低报价的。

门店总体价位判断

我在b站上学了一招，很好用。就是找一个标品，看看厂家怎么报价。b站是推荐的标品是外面包裹着钢架+编织布的皮沙发，18元一尺的皮，3个模块，大概3米的样子。这个东西价格成本比较透明，不同厂家都差不多，卖价基本上在12000-18000的样子。我在一个平价店和一个中高端店看到了这个沙发，我问的是布沙发的价格，真就一个报12000一个报18000。

沙发品质判断

对于皮质沙发来说，最重要的区别是全皮\半皮全青\半青

全皮：所有面都是用真皮
半皮：接触面用真皮，非接触面用看起来差不多的人造皮。但不同厂家对“非接触面”的定义不一样
全青：头层皮，通常更贵，更好看
半青：二层皮，通常更便宜，但更耐用

b站上也教了不少其他指标，例如：

海绵硬度（多少多少D，一般硬度越高越贵海绵一般大家都用三层，不同层硬度不同，所以也没有严格的可比性）
海绵高度（多少多少分，就是多少多少厘米我问了好几个销售这个问题，他们都一脸懵逼，看来不是常用指标）
五金材料（铝>不锈钢>铁\高碳钢铁不好，一般是不锈钢）
骨架木料（橡木、胡桃木>松木>桉木、橡胶木一般是用松木）
皮革价格（多少多少钱1尺）

我觉得最有用的还是皮革价格这一指标。其他项大家基本都差不多。

全青皮通常是 25-35元，高的能到50
半青皮通常是 16-20元，低的见过12的
不同的商家，用同样价格的皮，售价有时候能差出1倍，我很震惊。

谈价

谈价部分我说的也仅供参考。因为中高端的我没怎么谈价，中端家具店的谈价空间很小。但总的来说，在厂家报了价后，肯定还有一个折扣是可以谈的。名义上是你买的多，就给你打98、95、90折这样,但有的销售嘴就很松，你买的少也可以尝试争取9折优惠。

去的厂家

奥蓝图/吾距

产品中端，价格中高端。
第一家去的，价格偏贵，东西偏差。
4米迪兰沙发半皮半青报价21000。展厅的迪兰沙发有非常明显的两处瑕疵，我在更便宜的厂都没看到类似问题。
多层板包皮的餐桌要卖到6000，正常是2000的样子。

众观

中高端，东西不错，但很贵。
展厅做得非常好，很新，搭配都不错。博领的销售和我说，众观是靠和买手孙耀合作发展起来的，东西偏贵。在酒店拉客的司机也推荐我去这里，这里的东西渠道溢价可能是比较高的。
3.6米迪兰沙发半青（忘记是全皮还是半皮了）报价41000

博领

中高端，东西不错，价格小贵。
展厅在顺联北，分散有20多个展厅，不停的到处走。东西很多，有好多款式别的地方根本找不到。我们在这里看中的件是最多的，但买不太起。迪兰全皮半青报价32000
博领是意式中高端家具里绕不开的一个店，一定要去看看。完全可以以它为基准。

布兰洛

中端，质量价格都是中等。
属于是中端里面的标杆。展厅比较老了，搭配得也不是特别好，但一看就知道卖得多，参数非常全。
迪兰半皮半青报价18500

摩登翡丽

中高端。相当贵，以轻奢为主，我是极简，随便看了一下，迪兰报价55000。不值当

库兰德

中端，东西还行，价格非常便宜。
是看的这些店最便宜的。迪兰半青半皮报价13500。
地方不太好找，电梯自己不能按，得站里面，老板在上面按才能送上去。但东西是真便宜，质量也不错，仔细看了一下，没有什么瑕疵。我们仔细体验了一下迪兰的坐感，是挺舒服的，但比起标准的迪兰偏软，尺寸比标准的也小了十几公分，但都不算是缺点。
这种就属于是平价的店，比长沙便宜几千。大概率床和沙发在这里买。

方匠

中端，东西挺好，价格便宜。
所有品类都不贵，都是属于合理的价格。没有迪兰沙发，像素沙发全皮全青报价20800，这个价格是相当便宜的了，坐起来非常舒服，用的全青皮说是28.8一尺，一度犹豫要不要买这个沙发。1.6米岩板餐桌2000,1.8米中花白奢石餐桌5300，都属于是非常合理的价格。
在这里看中了休闲椅，餐桌，学习桌，椅子。

观山

中高端。东西很好，但贵。
本来是寄予厚望的，没想到太贵了。同样是18元一尺的半青皮，迪兰半皮沙发报价27295，比库兰德贵一倍。工厂就在展厅下面，我们还去逛了一下工厂，看了一下半成品，东西确实精致。

厂家评价总结表

厂家	定位	质量/做工	价格	典型报价	备注	推荐
奥蓝图/吾距	中端产品，价格中高端	东西偏差，展厅沙发有明显瑕疵	偏贵	4米迪兰半皮半青 21000；多层板包皮餐桌 6000（常见≈2000）	第一家看的，性价比不佳	低
众观	中高端	东西不错、展厅很新	很贵（疑似渠道溢价高）	3.6米迪兰半青 41000（全/半皮不确定）	与买手合作出圈，溢价高	中-
博领	中高端	东西不错、款式多	价格小贵	迪兰全皮半青 32000	顺联北展厅分散多；中高端基准店	中+
布兰洛	中端	质量中等	价格中等	迪兰半皮半青 18500	展厅偏老，参数齐全	中
摩登翡丽	中高端（轻奢）	—	非常贵	迪兰 55000	轻奢为主，对极简不友好	低
库兰德	中端	细看无明显瑕疵，坐感偏软	非常便宜	迪兰半青半皮 13500	地点隐蔽；尺寸比标准略小但可接受	高（沙发/床优先考虑）
方匠	中端	东西挺好，像素沙发坐感佳	便宜且合理	像素沙发全皮全青 20800（皮28.8/尺）；1.6m岩板桌 2000；1.8m中花白奢石桌 5300	全品类价格友好，无迪兰；看中多件品类	高
观山	中高端	做工精致、东西很好	贵	迪兰半皮，半青18/尺报价27295	工厂在展厅下，半成品精致	中

hive数据跨集群迁移方法

发表于 2025-07-07 更新于 2025-08-18 分类于技术笔记
本文字数： 269 阅读时长 ≈ 1 分钟

使用csv为载体

从原集群中导出数据为csv。可以使用语句，也可以使用dbeaver之类的数据库连接软件
删除第一行表头，删除所有双引号
存储到新集群的hdfs中 hadoop dfs -put export.csv /user/username

新hive集群创建分区表，另外创建接受csv数据的临时表。csv文件无法直接导入分区表中，只能额外使用一张临时表过渡一下

drop table db.tablename_csv;
CREATE TABLE db.tablename_csv (
   columns
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY '$'
LINES TERMINATED BY '\n'
STORED AS TEXTFILE;

load data inpath '/user/username/export.csv' into table db.tablename_csv; 
-- ALTER TABLE db.tablename DROP PARTITION (logdate <= 20230605);

在trino中将csv临时表数据导入分区表中

1 2	insert into hive.db.tablename select * from hive.db.tablename_csv where logdate>'20240605';

使用hive export的方式

原集群上导出数据：

hadoop dfs -mkdir /user/username/db.table
hive>export table db.table to '/user/username/db.table';
hadoop dfs -get  /user/username/db.tablename
tar -czvf ./tablename.tar.gz ./db.tablename/

export语句是可以指定分区的，但似乎只能指定一个分区。

新集群上导入数据：

1 2	hadoop dfs -put db.tablename /user/username hive>import table db.tablename from '/user/username/db.tablename';

AI架构展望

发表于 2025-05-12 更新于 2025-08-18 分类于 AI
本文字数： 6.6k 阅读时长 ≈ 24 分钟

架构图

背景

大数据与AI的关系

大数据让人工智能变得更加智能，
人工智能让大数据变得更有价值。

大数据为AI提供“燃料”
- 训练基础：深度学习模型依赖大量数据训练，数据量直接影响模型性能。
- 多样性增强：结构化与非结构化数据的融合（如文本、图像、传感器数据）帮助AI捕捉复杂模式。
- 数据质量提升：清洗与标注技术优化减少AI模型的“垃圾输入”问题。
AI为大数据提炼价值
- 智能分析：AI通过深度学习从数据中自动发现非线性关系。
- 实时决策：结合流数据处理，AI实现秒级甚至毫秒级响应。
- 数据生成与增强：生成式AI可合成虚拟数据，缓解数据稀缺问题。

AI数字化转型路线

基础设施云化与数据资产化
核心目标：构建数字化底座，让数据成为核心资产
- 云原生架构：采用混合云、私有云，提升弹性算力（如中信证券与阿里云合作搭建金融云）。
- 数据中台：整合交易、客户、市场数据，形成统一数据资产（如华泰证券的“数据工厂”）。
- AI 算力储备：部署 GPU/TPU 集群，支持大模型训练（如国泰君安自建 AI 算力中心）。
业务智能化与自动化
核心目标：用 AI 重构核心业务流程，提升效率与体验
- 智能投研：AI 辅助研报生成、舆情分析（如中金公司“AI 策略报告”）。
- 智能投顾：个性化资产配置（如广发证券“贝塔牛”）。
- 智能风控：实时监测异常交易（如东方证券 AI 风控系统）。
- RPA+AI：自动化运营（如东吴证券合同审核效率提升 80%）。
服务场景化与生态化
核心目标：从“单一金融产品”转向“场景化服务生态”
- 嵌入场景：与互联网平台合作（如华泰证券与同花顺、雪球合作）。
- 开放 API：让客户、第三方开发者接入（如中信证券 CAP 开放平台）。
- 数字员工：AI 客服、AI 投顾（如中信证券“数字人助理”）。

层级与组件介绍

数据层

核心作用：为上层提供多模态数据支持，以及各种形态数据的存储、管理、访问。
关键组件：
- 流式数据载体：Kafka（消息队列）
- 结构化数据：Hive（批处理结果）。
- 非结构化数据：多模态数据湖（图像视频/音频/文本/文件等）。
- 搜索工具：ES（全文检索），Milvus（向量管理与检索）。
典型应用：模型训练的数据来源、智能体的知识库基础。

多模态数据湖

以Deep Lake为例，其核心功能包括：

多模态数据支持：
支持图像、视频、音频、文本、PDF、DICOM（医学影像）等数据类型，统一存储为张量格式（如 NumPy 数组），兼容 PyTorch/TensorFlow 等框架。
版本控制：
类似 Git 的分支管理（commit/checkout）、标签功能和合并操作，便于团队协作和实验回溯。
高效查询与检索：
- TQL 查询引擎：支持语义搜索和过滤（如 ds.filter(lambda x: x.label == ‘cat’)）。
- 向量搜索：集成 LangChain/LlamaIndex，适用于 LLM 应用的嵌入检索。
性能优化：
- 流式加载：惰性加载数据，减少训练等待时间。
- 原生压缩：图像/视频保持压缩格式，节省存储空间。

向量数据库

以Milvus（Faiss基础上开发）为例，其搜索功能包括：
KNN 搜索：查找最接近查询向量的前 K 个向量。
过滤搜索：在指定的过滤条件下执行 ANN 搜索。
范围搜索：查找查询向量指定半径范围内的向量。
混合搜索：基于多个向量场进行 ANN 搜索。
全文搜索：基于 BM25 的全文搜索。
Rerankers：根据附加标准或辅助算法调整搜索结果顺序，完善初始 ANN 搜索结果。
获取：根据主键检索数据。
查询：使用特定表达式检索数据。

整体数据流向

基建层

核心能力：行业垂直模型开发与管理、知识库、AI应用程序框架、实时应用框架。
关键模块：
- 模型相关：大语言模型、Embedding生成/检索、模型蒸馏（轻量化）。
- 知识管理：检索增强（RAG）、知识库构建。
- 应用程序框架：LangChain（链式应用框架),Dify(链式应用框架的低代码平台),AutoGPT(自主任务执行），MetaGPT(多智能体协作框架)
目标：支持从通用大模型到垂直领域微调的完整流程。

行业垂直模型

本人对模型了解不多，只给出一些可能方向

金融大语言模型（LLM）
- 微调方式：
  - 指令微调（如“生成某股票的深度分析”）
  - RLHF（人类反馈强化学习）确保合规性（如避免误导性投资建议）
- 精调：数百条高质量样本，强化某些注意力头
- 核心能力：
  - 金融文本理解（如财报摘要、行业趋势分析）
  - 投资逻辑推理（如“为什么某股票近期下跌？”）
  - 合规审核（如识别潜在违规表述）
语音模型（ASR+TTS+NLP）
- 语音识别（ASR）：高精度金融术语识别（如“市盈率”“量化宽松”）。
- 语音合成（TTS）：自然语音播报（如实时行情播报、AI投顾交互）。
- 语音NLP：
  - 客户语音查询理解（如“帮我查一下宁德时代的研报”）
  - 情绪分析（如识别客户投诉或投资焦虑）
多模态模型（视觉+文本）
- 图表理解：解析K线图、财报图表、行业趋势图。
- 文档OCR：扫描合同、研报、公告，提取关键信息。
- 视频分析：解读财经新闻视频、路演直播内容。

RAG

RAG（Retrieval-Augmented Generation，检索增强生成）是AI领域的一项前沿技术，旨在通过结合外部知识检索与生成式模型的能力，提升大型语言模型（LLM）在知识密集型任务中的准确性和时效性。

RAG通过以下几个关键阶段工作：

数据准备：
- 数据提取
  - 数据加载：包括多格式数据加载、不同数据源获取等，根据数据自身情况，将数据处理为同一个范式。
  - 数据处理：包括数据过滤、压缩、格式化等。
  - 元数据获取：提取数据中关键信息，例如文件名、Title、时间等。
- 文本分割(Chunking)：
  文本分割主要考虑两个因素：1）embedding模型的Tokens限制情况；2）语义完整性对整体的检索效果的影响。一些常见的文本分割方式如下：
  - 句分割：以”句”的粒度进行切分，保留一个句子的完整语义。常见切分符包括：句号、感叹号、问号、换行符等。
  - 固定长度分割：根据embedding模型的token长度限制，将文本分割为固定长度（例如256/512个tokens），这种切分方式会损失很多语义信息，一般通过在头尾增加一定冗余量来缓解。
- 向量化（embedding）：
  向量化是一个将文本数据转化为向量矩阵的过程，该过程会直接影响到后续检索的效果。目前常见的embedding模型如表中所示，这些embedding模型基本能满足大部分需求，但对于特殊场景（例如涉及一些罕见专有词或字等）或者想进一步优化效果，则可以选择开源Embedding模型微调或直接训练适合自己场景的Embedding模型。
检索阶段：
- 文本：
  - 利用传统信息检索模型（如BM25）从外部知识库（全文搜索数据库）中检索与用户查询相关的文档片段。
  - 使用词向量，与传统信息检索模型类似
  - 利用上下文相关模型（如BERT）生成句向量进行向量检索
- 多媒体与文件：用户提问时，问题被实时向量化，通过近似最近邻（ANN）算法（如HNSW）快速匹配最相关的知识片段
生成阶段：将检索到的上下文输入LLM，生成基于实际知识的回答，而非仅依赖模型预训练的参数化知识。

检索阶段的优化途径：

查询转换。使用 LLM 作为推理引擎来修改用户输入以提高检索质量。
分层索引。摘要和正文分开索引，先快速检索摘要，再检索正文
假设性问题和 HyDE。LLM 为每个块生成一个问题，并将这些问题嵌入到向量中，在运行时对这个问题向量的索引执行查询搜索（将块向量替换为索引中的问题向量），然后在检索后路由到原始文本块并将它们作为 LLM 获取答案的上下文发送。这种方法提高了搜索质量，因为与实际块相比，查询和假设问题之间的语义相似性更高。还有一种叫做 HyDE 的反向逻辑方法——你要求 LLM 在给定查询的情况下生成一个假设的响应，然后将其向量与查询向量一起使用来提高搜索质量。
检索结果增强。两种选择：一种是将检索出来的较小的文本块的上下文一并返回；另一种是如果检索出的多个小块归属于同一个大块，则将这个大块整个返回
融合检索或混合搜索：同时使用传统全文搜索和向量检索召回结果，通过Reciprocal Rank Fusion 算法进行结果的重排序并且返回。
重排（reranking）和过滤（filtering）根据相似性分数、关键字、元数据过滤掉结果，或使用其他模型（如 LLM）、sentence-transformer 交叉编码器，Cohere 重新排名接口或者基于元数据重排它们。

常见的Embedding生成器

模型名称	类型	支持语言	最大Token	特点	适用场景
OpenAI text-embedding-3-small	文本	多语言	8192	轻量级，检索任务平均分61.0，适合快速验证	通用文本检索、RAG基础版
OpenAI text-embedding-3-large	文本	多语言	8192	高精度，检索任务平均分64.6，延迟较高	高精度语义匹配、复杂问答
BGE-M3	文本	194种	8192	多语言榜首，支持密集/稀疏/多向量检索，长文本处理强	多语言知识库、长文档解析
Sentence-BERT	文本	多语言	512	句子级嵌入，语义相似度计算精准，开源易部署	短文本匹配、推荐系统
ResNet50	图像	-	-	图像特征提取老将，适合以图搜图	电商图片检索、视频帧分析
PANNs	音频	-	-	预训练音频模型，支持音乐分类、语音检索	音频内容识别、智能客服录音分析
CLIP/SigLIP	多模态	多语言	77（文本）	文图互搜，SigLIP优化了zero-shot效果，适合跨模态搜索	广告创意检索、多模态推荐
Word2Vec	文本	单语言	-	经典词向量，训练成本低，但无法处理一词多义	简单语义分析、教学演示

词向量转句向量方法：

短文本：优先尝试BERT的[CLS]向量或SIF加权
长文档：使用LSTM分层编码或分段+池化
资源受限：TF-IDF加权平均+PCA降维
* 领域适配：在目标数据上微调Sentence-BERT

应用程序框架对比

维度	LangChain	Dify	AutoGPT	MetaGPT
产品形态	Python/JS代码库（需编程）	可视化低代码平台（BaaS+LLMOps）	自主任务执行的AI	Agent框架
抽象层级	底层模块化工具链（高灵活性）	高度封装（开箱即用）	任务自动化引擎（目标驱动）	高层工作流编排（角色分工/SOP标准化）
目标用户	开发者/技术团队（需编程能力）	全团队协作（非技术成员可参与）	个人/企业（自动化需求）	企业开发者/AI工程团队（需复杂任务自动化）
模型支持	需手动适配接口（如HuggingFace）	一键切换数百个模型（统一API）	默认依赖GPT系列，社区扩展有限	依赖大模型API（如GPT-4生成代码/规划）
扩展性	高（可集成任意API/数据库）	依赖插件市场，企业功能完善	任务分解能力强，但生态较封闭	模块化设计（可自定义角色/工具链）
核心优势	灵活性高，适合复杂系统	开发效率极快，企业级支持完善	自动化任务执行	标准化协作流程（显式分解复杂任务）
主要短板	学习曲线陡峭，维护成本高	定制能力有限	资源消耗大，稳定性待提升	成本敏感（多Agent调用放大API开销）

实时性支持

实时性支持此处列举得比较简单，但其实施通常是对整个链路的改造，包括以下几个方面：
1. AI agent感知层的实时触发

事件驱动架构：
- 采用消息队列（如Kafka/Pulsar）或边缘设备事件触发器（如IoT传感器），实现毫秒级事件感知。
- 示例：工业质检Agent通过摄像头帧级事件实时捕捉产品缺陷。
流式数据处理：
- 集成流计算框架（Flink/Spark Streaming），对输入数据实时清洗与特征提取。
- 挑战：高并发场景下需平衡吞吐量与延迟（如自动驾驶需<100ms响应）。

RAG流式更新知识
- 动态索引构建：
  - 增量索引技术（如Elasticsearch的_update_by_query）支持文档级实时更新，避免全量重建索引的延迟。
  - 优化点：结合向量数据库（Milvus/Pinecone）的相似度检索，确保新知识即时生效。
- 多级缓存策略：
  - 热点知识缓存在内存（Redis），冷数据下沉至磁盘，平衡实时性与成本。
  - 案例：金融风控Agent实时同步监管政策变更至缓存层。
工具层的实时性支持
- 低延迟工具调用：
  - 工具API设计遵循轻量化原则（如gRPC替代REST），预加载工具上下文减少冷启动延迟。
  - 示例：电商客服Agent调用库存API时，通过HTTP长连接保持会话状态。
- 异步执行与超时熔断：
  - 工具调用采用异步协程（如Python asyncio），超时机制（如Hystrix）避免阻塞主线程。
数据层的实时性支持
- 实时数仓与OLAP优化：
  - 使用实时OLAP引擎（ClickHouse/Doris）或时序数据库（InfluxDB），支持亚秒级聚合分析。
  - 技术选型：Lambda架构兼顾实时流（Flink）与批处理（Hive）数据一致性。
- 分布式状态管理：
  - 通过分布式快照（如Flink Checkpoint）保证Agent状态跨节点实时同步，避免决策偏差。

底层应用

底层应用是AI Agent的工具模块的一部分。由于上下文提示的影响，Agent也可能无法导向正确的知识，甚至产生知识幻觉。再加上缺乏语料库、训练数据以及针对特定领域和场景的调整，在专注于特定领域时，Agent的专业知识也会受到限制。专业化工具能让 LLM 以可插拔的形式增强其专业知识、调整领域知识并更适合特定领域的需求。

业务场景：
- 大数据应用：客户画像、数据血缘分析。
- 垂直业务：智能客服、精准营销、风险处置。
特点：直接解决具体业务问题，依赖下层技术支撑。

AI Agent智能体

架构核心：自主决策与协作系统。
关键设计：
- 单智能体：包含感知→决策→执行的闭环（如零售智能体的推荐逻辑）。
- 多智能体系统：通过通信模块协作（如风控+量化智能体联合决策）。

智能体组成

AI Agent（智能代理）是一个能够感知环境、自主决策并执行动作的智能系统，其核心组成和实现方式通常包括以下部分：
1. 感知模块（Perception）

作用：从环境中获取信息（如传感器数据、用户输入、网络数据等），并将其转化为结构化数据供其他模块处理。
实现方式：
- 传感器：物理设备（如摄像头、麦克风）或软件接口（API、网页爬虫）。
- 自然语言处理（NLP）：解析文本或语音输入（如BERT、GPT）。
- 计算机视觉：处理图像/视频（如CNN、YOLO）。
- 数据预处理：清洗、归一化、特征提取等。

决策模块（Reasoning/Planning）
- 作用：基于感知信息、内部知识库和目标，制定行动策略或生成响应。
- 实现方式：
  - 规则引擎：基于预定义规则（如专家系统）。
  - 机器学习模型：通过强化学习（RL）、深度学习（DL）或符号逻辑推理（如Prolog）。
  - 规划算法：如A*搜索、蒙特卡洛树搜索（MCTS）用于路径规划或任务分解。
  - 大语言模型（LLM）：如GPT-4生成对话或决策建议。

方法	优势	局限性	适用场景	技术依赖
规则引擎	透明、易解释	灵活性低，规则维护成本高	结构化流程（如审批）	专家知识库
规划算法	支持多步骤任务分解	计算复杂，需环境模型	机器人导航、供应链优化	图搜索算法、动态规划
强化学习	自适应动态环境	训练成本高，奖励设计困难	游戏AI、实时控制	深度神经网络、模拟环境
大模型推理	泛化能力强，自然语言交互	可能产生幻觉，算力需求高	开放域问答、创意生成	LLM、RAG、工具调用API

基于大模型的决策方法：

ReAct框架：交替执行推理（Reasoning）和行动（Acting），例如：

while not goal_achieved:
    state = perceive()          # 感知环境
    thought = llm_reason(state) # 生成推理
    action = decide(thought)    # 选择动作
    execute(action)            # 执行

* 思维链（CoT）：引导LLM分步推理，提升复杂任务解决能力.例如：用户：某个城市的 GDP 是否比全国平均值高？Agent（CoT）：首先获取该城市的 GDP 数据 -> 获取全国 GDP 平均值 -> 进行比较 -> 生成答案。

记忆模块（Memory）

作用：存储短期/长期信息，支持上下文理解和学习。
实现方式：
- 短期记忆：缓存当前会话的上下文（如对话历史）。
- 长期记忆：知识图谱、向量数据库（如FAISS）、SQL数据库。
- 检索增强生成（RAG）：结合外部知识库提升回答准确性。

执行模块（Action）

作用：将决策转化为具体行动，影响环境或用户。
实现方式：
- 物理执行器：机器人控制电机、机械臂。
- 软件接口：调用API（如发送邮件、控制智能家居）。
- 自然语言输出：语音合成（TTS）或文本生成（如ChatGPT）。

学习模块（Learning）

作用：通过反馈优化行为（在线学习或离线训练）。
实现方式：
- 监督学习：标注数据训练模型（如分类任务）。
- 强化学习（RL）：通过奖励机制调整策略（如AlphaGo）。
- 联邦学习：分布式数据下的隐私保护学习。

通信模块（Communication）

作用：与用户、其他Agent或系统交互。
实现方式：
- 自然语言交互：基于NLP的对话系统。
- 协议接口：HTTP/RPC、消息队列（如MQTT）。

Agent性能衡量

常见评估指标：

任务成功率（Task Completion Rate）
工具调用准确率（Tool Usage Accuracy）
推理质量（Reasoning Quality）
用户满意度（User Satisfaction）

多智能体

多智能体系统（Multi-Agent System, MAS）是由多个AI Agent组成的协作网络，这些Agent通过通信和协同工作，共同完成复杂任务。多智能体的核心优势在于：
1. 分工协作：不同Agent专精于特定任务（如搜索、数据分析、代码生成等），通过任务拆解和分配实现高效协同。
2. 复杂任务处理：单个Agent难以完成的复杂任务（如全域营销、供应链优化），可通过多Agent协作分阶段解决。
3. 适应性更强：动态环境中，多Agent系统能通过实时交互调整策略，例如无人机编队或金融风控场景。

架构设计

分层协作：参考Manus的三大模块：
- 规划模块：拆解任务并分配子任务（如将“旅游保险分析”拆解为PDF解析、数据对比等步骤）。
- 执行模块：调用专用Agent（如Content Agent生成报告）。
- 验证模块：审核结果准确性后交付用户。
通信协议：采用标准化框架（如InterAgent协议）确保Agent间互操作性，类似区块链中的智能合约协调。

开发框架与工具

开源平台：
- AutoGen：支持多Agent对话和人类参与，适合构建聊天机器人协作系统。
- CrewAI：强调流程化任务分配，适合顺序性强的场景（如自动发邮件流程）。
- MetaGPT：基于角色设计的框架，模拟软件开发团队分工。
商业化应用：如Manus的付费多Agent服务，或微盟的“数字员工”企业级解决方案。

案例

数据分析智能体

以下场景为deepseek生成。（从侧面体现了LLM的决策能力）
提示词：请你设计一个数据分析智能体，用对话的形式，实现“描述性分析”与“探索性分析”两种分析场景。能用到的工具有：数据地图，数据卡片平台，归因分析平台，客户画像系统，数据血缘，埋点平台、客群分析平台等

数据分析智能体对话设计
1.	 启动对话（意图识别）
用户：我想分析最近三个月的销售数据。
智能体：
您好！我将协助您完成分析。请问您需要哪种分析类型？
* 描述性分析：快速了解数据分布（如均值、趋势、异常值）。
* 探索性分析：深入挖掘潜在模式（如归因、客群差异）。
2.	 描述性分析场景（基础统计与可视化）
用户：先做描述性分析。
智能体：
已通过数据地图定位到销售数据集，包含订单量、销售额、地区等字段。以下是关键统计结果：
a.	数据卡片平台生成摘要：
    * 销售额均值：x=120万（环比+15%）
    * 订单量分布：华东占比45%（异常值：3月15日单日订单激增200%）
b.	可视化建议：
    * 折线图（时间趋势）
    * 热力图（地区销售密度）
是否需要进一步拆分维度（如按产品类别）？
3.	 探索性分析场景（深度挖掘）
用户：为什么华东地区销售额突增？
智能体：
正在调用工具链进行多维度归因：
a.	归因分析平台：
    * 关键因子：促销活动（贡献度62%）、新客增长（25%）
b.	客户画像系统：
    * 新客特征：25-35岁女性，偏好高单价品类（通过埋点平台追踪行为路径）
c.	数据血缘验证：
    * 活动数据与销售数据链路完整，无ETL异常
建议下一步：
  * 通过客群分析平台对比华东与其他地区用户画像差异
  * 需检查促销活动ROI吗？
4.	动态交互与工具调度
用户：我想看促销活动的转化漏斗。
智能体：
已从埋点平台提取用户行为事件，生成漏斗图：
  * 曝光→点击转化率：12%（低于平均水平15%）
  * 点击→下单转化率：8%（行业基准7%）
异常定位：
  * 曝光环节流失率高，建议检查广告投放渠道（数据血缘显示部分渠道数据缺失）
5.	 总结与自动化建议
智能体：
分析完成！是否需要：
a.	保存当前分析流程至数据卡片平台供复用？
b.	设置自动化监控（如销售额异动触发归因分析）？

flowchart LR
    %% 分层架构
    subgraph 用户交互层
        A[自然语言输入] --> B[对话引擎]
        B --> C[可视化卡片-图表/表格/摘要]
        C --> D[交互式追问]
    end

    subgraph 分析服务层
        B --> E{分析类型路由}
        E --> |描述性分析| F[查询引擎]
        E --> |探索性分析| G[归因分析平台]
        E --> |探索性分析| H[客群分析平台]
        F --> I[查询可视化平台]
        G --> J[客户画像系统]
    end

    subgraph 数据治理层
        I & G & H --> K[数据地图]
        K --> L[数据湖]
        L --> M[结构化数据]
        L --> N[非结构化数据]
        M --> O[数据血缘]
    end

    subgraph 支撑系统
        Q[元数据管理] --> K
        R[权限控制] --> L
        S[查询缓存] --> F
    end

    %% 关键数据流
    F -.-> |SQL/API| L
    I -.-> |渲染图表| C
    P -.-> |实时事件流| H
    O -.-> |血缘校验| G
    J -.-> |生成摘要| C

可能的方向

员工效率提升
- 重复性工作：数据录入、报表生成、邮件分类等规则明确的流程。
- 预测分析：基于历史数据的销售预测、风险评估。
- 辅助性数据探索工作：ChatBI
- 实时响应：客服聊天机器人（如回答常见问题）。
信息处理与生成
- 内容创作：生成文本（研报、市场简报）、图像/视频合成（研报文生图）。
- 事件驱动分析：识别突发事件对行业的影响（如疫情对航空股冲击）。
- 知识检索：快速搜索并整合信息（投研问答）。
风险管理与合规
- 异常交易监测：识别操纵市场、老鼠仓等模式（如监测账户关联性）。
- 反洗钱（AML）：AI分析资金流水，标记可疑交易
客户服务与营销
- 智能投顾：根据风险问卷生成标准化组合。
- 精准营销：通过用户行为分析推荐产品（如低风险客户推国债逆回购）。
- 合规质检：AI监听客服通话，实时提示违规话术（如承诺收益）。

明日方舟公开招聘4星以上组成速查表

发表于 2025-05-10 更新于 2025-08-18 分类于游戏
本文字数： 161 阅读时长 ≈ 1 分钟

公开招募工具
✓✓✓ = 最多6星 | ✓✓ = 最多5星 | ✓ = 最多4星

词条+词条

词条组合	支援	狙击	远程位	位移	减速	控场	召唤	削弱	爆发	费用回复	近战位	治疗	快速复活	群攻	生存	防护	输出
支援	-				✓✓✓	✓✓✓				✓✓		✓		✓✓✓	✓✓	✓✓✓	✓
狙击		-	✓✓														✓✓
远程位		✓✓	-			✓	✓	✓	✓✓	✓					✓	✓✓
位移				-	✓✓	✓✓✓					✓					✓✓	✓✓
减速	✓✓✓			✓✓	-	✓✓					✓	✓		✓			✓
控场	✓✓✓		✓	✓✓✓	✓✓	-	✓✓			✓✓			✓✓	✓✓✓			✓
召唤			✓			✓✓	-			✓
削弱			✓					-			✓✓		✓✓	✓✓			✓
爆发			✓✓						-					✓✓			✓
费用回复	✓✓		✓			✓✓	✓			-		✓
近战位				✓	✓			✓✓			-		✓
治疗	✓				✓					✓		-					✓✓
快速复活						✓✓		✓✓			✓		-			✓	✓
群攻	✓✓✓				✓	✓✓✓		✓✓	✓✓					-		✓✓	✓
生存	✓✓		✓												-	✓✓
防护	✓✓✓		✓✓	✓✓									✓	✓✓	✓✓	-	✓✓
输出	✓	✓✓		✓✓	✓	✓		✓	✓			✓✓	✓	✓		✓✓	-

词条+职业

词条组合	输出	减速	快速复活	召唤	支援	控场	爆发	位移	狙击	治疗	防护	削弱	生存	远程位
先锋				✓	✓✓					✓				✓
术师		✓			✓✓✓	✓	✓✓			✓✓	✓✓	✓
辅助	✓✓			✓✓	✓✓	✓✓				✓		✓✓	✓✓
重装	✓✓				✓✓✓			✓✓					✓✓
狙击		✓				✓✓✓	✓✓		-			✓	✓
医疗					✓
特种	✓	✓✓	✓		✓✓✓	✓✓		✓			✓	✓✓	✓✓	✓✓✓
近卫		✓					✓				✓✓

行业垂直大模型构建

发表于 2025-04-30 更新于 2025-08-18 分类于 AI
本文字数： 3.1k 阅读时长 ≈ 11 分钟

RAG OR 微调

检索增强生成(RAG)是一种通过外部知识库增强大模型输出的技术架构。其核心思想是将领域专业知识存储在向量数据库中，在生成回答时先检索相关文档片段，再将检索到的内容与用户问题一起输入大模型生成最终回答。RAG的主要优势在于实现成本低、知识更新便捷且能有效避免模型幻觉问题。在证券行业应用中，RAG系统可以通过实时接入市场数据和研究报告，确保输出的分析建议基于最新信息。国金证券的实践表明，RAG在数据与上下文相关的情况下非常有效，例如在解释特定金融数据时，同时能产生比基础模型更简洁的响应。然而，RAG也存在局限性，如输入token数量会增加提示信息量，且输出token数量往往更详细且更难精确控制。

模型微调则是通过领域数据继续训练预训练大模型，使其内部参数适应目标领域。微调技术可分为全参数微调和参数高效微调(如LoRA)两类。微调的优势在于能够使模型真正”理解”证券领域知识，生成更专业、更简洁的输出。研究显示，微调非常有效，能提供在特定领域学习新技能的机会，例如改进投资决策分析或根据市场模式优化投资组合建议。国金证券的技术探索表明，采用LoRA等参数高效微调方法，仅需调整0.1%左右的参数即可显著提升模型在证券任务上的表现。但微调也面临挑战，包括需要大量工作来准备训练数据，以及可能导致模型出现”灾难性遗忘”现象（即在学习新任务后丧失原有知识）。

技术特性	检索增强生成(RAG)	模型微调(Fine-Tuning)
实现复杂度	相对较低，主要构建知识库和检索系统	较高，需要准备训练数据和计算资源
知识更新	实时便捷，只需更新知识库	需要重新训练或增量训练
输出质量	依赖检索结果，可能不够流畅	更专业、简洁的输出
计算成本	推理时成本较高（长上下文）	训练成本高，推理成本低
适用场景	知识密集型、需最新数据的任务	需要深度领域理解的任务

证券行业大模型的构建往往需要混合使用RAG和微调技术，以发挥各自优势。
结合外部知识库和提示工程对通用大模型调优的技术方案最适合证券行业特点。这种混合方法在保留良好对话效果的同时，训练成本非常低，能够有效避免模型微调后的灾难性遗忘问题以及减少模型出现事实错误（幻觉）的情况。
在实际应用中，证券机构可根据具体场景需求选择技术路线组合：

对于需要实时市场数据的交易分析场景，可侧重RAG架构；
对于需要深度行业知识的研究报告生成，可采用微调+RAG的组合；
对于合规审查等专业化任务，则可依赖经过充分微调的领域专用模型

数据准备与处理：构建高质量金融语料库

构建证券行业垂直大模型的基础在于准备高质量、大规模的金融领域专业数据。

数据类型

结构化数据
- 市场行情数据
- 公司财务数据
- 交易记录
非结构化数据
- 研究报告
- 财经新闻
- 公司公告
- 分析师评论
- 金融论坛讨论等文本内容

数据类型	数据示例	处理难点	解决方案
市场交易数据	股价、成交量、融资融券数据	高频、时序性强	时间序列标准化、异常值检测
公司披露文件	年报、招股书、重大资产重组公告	格式复杂、专业术语密集	PDF解析、关键信息抽取
研究报告	券商行业分析、公司深度报告	含图表、观点隐含	结构化解析、观点挖掘
财经新闻	市场快讯、政策解读	质量参差不齐、观点混杂	来源可信度评估、情感分析
互动平台数据	投资者问答、股吧评论	非正式表达、噪声大	slang处理、情绪识别

数据处理

数据预处理是确保模型训练质量的关键环节，主要包括清洗、过滤和去重三个步骤。

清洗过程需要处理文本编码问题、特殊字符、无关广告内容等噪声；
过滤阶段则依据数据质量指标去除低质内容；
去重操作确保语料库中不存在高度相似或重复的文档。

证券行业数据预处理还需特别关注时序性处理，因为金融市场规则和公司状况会随时间变化，过时信息可能误导模型产生错误知识。例如，某上市公司历史上的财务造假事件可能已被记录在网络文本中，但经过整改后当前该公司可能已合规经营，这就需要在大模型知识库中明确标注信息的时间有效性。

领域名词

证券行业充斥着专业术语（如”可转换债券”、”市盈率”、”量化宽松”等）和行业特定表达方式，常规的自然语言处理工具可能无法准确分割或理解这些内容。在构建语料库时，需要采用结合金融词典的分词技术，并可能需要对通用语言模型进行领域适配性微调，以提高文本处理的准确性。

模型训练与优化策略

参数高效微调技术

LoRA（Low-Rank Adaptation）的工作原理是在原始模型参数旁添加低秩分解的适配矩阵，训练时固定原始参数，仅更新这些适配矩阵。具体而言，假设预训练基座大模型的矩阵为W₀∈R^(d×k)，其更新则表示为低秩分解：W₀ + ΔW = W₀ + BA，其中B∈R^(d×r)，A∈R^(r×k)，秩r << min(d,k)。在前向传递过程中，W₀与ΔW都会乘以相同的输入x，最后相加：h = W₀x + ΔWx = W₀x + BAx。

LoRA的微调流程：初始化预训练基座大模型后冻结底层Transformer层；然后通过低秩分解更新部分参数，在训练过程中，W₀固定不变，不参加梯度更新，只训练参数矩阵A和B，得到模型更新参数ΔW。这种方法使训练成本大幅降低，同时保持模型性能。国金证券的实践表明，受影响的参数量通常仅为全量参数的0.1%左右，大大减轻了计算负担。

多任务训练

多任务指令微调是提升证券大模型业务适应性的重要手段。设置多种模型训练任务：证券行业相关问答、用户情感分析、研报观点生成、财报数据解读以及上市公司问答等领域性任务。根据不同任务设置指令微调格式化实例，构建对应的证券行业多任务微调数据集。这种方法使单一模型能够适应证券业务中多样化的应用场景。

Alpaca格式(适合指令微调)

[
  {
    "instruction": "分析该公司IPO前景",
    "input": "公司主营光伏组件，2023年营收增长45%，行业平均PE为25",
    "output": "基于行业PE和公司增长率，该公司IPO估值可能在...",
    "system": "你是一位资深证券分析师",
    "history": []
  }
]

港股IPO微调示例格式

{
  "question": "赤峰黄金招股信息概要",
  "answer": "最终分配结果:...;暗盘表现:...;首日表现:..."
}

多轮对话格式(ShareGPT)

{
  "conversations": [
    {"from": "human", "value": "如何评价这只债券的风险?"},
    {"from": "gpt", "value": "从信用评级、久期和收益率曲线分析..."}
  ]
}

对于证券分析，可加入复杂推理链条(CoT)：

{
  "Question": "生物制药公司IPO估值应注意什么?",
  "Complex-CoT": "需考虑研发管线阶段、临床试验结果、专利保护期...",
  "Response": "重点分析其临床三期药物成功率及市场竞争格局..."
}

知识遗忘

当大模型学习证券领域新知识时，可能会遗忘原有的通用知识或推理能力。缓解这一问题的策略包括：

保留部分通用能力的训练数据
采用渐进式微调（先通用任务后专业任务）
调整学习率等超参数

此外，混合使用RAG技术也能在一定程度上弥补模型自身的知识遗忘问题。

典型应用场景分析

智能投顾与客户服务是大模型在证券行业最直接的应用场景。传统证券服务面临海量零售客户需求与有限投顾资源的矛盾，大模型可通过智能问答系统提供7×24小时的个性化投资咨询服务。国金证券以AI助手为切入点，探索大语言模型提升工作效率赋能业务发展，通过自然语言交互降低系统使用门槛，使不熟悉专业系统的客户也能便捷获取服务。智能客服系统可处理账户查询、交易规则解释、市场概览等常见问题，复杂问题则转接人工服务，实现服务资源优化配置。

投资研究与分析是大模型创造高价值的核心领域。证券研究涉及大量信息收集、数据处理和报告撰写工作，非常适合大模型辅助。大模型可自动提取上市公司财报关键信息，对比行业数据，生成初步分析；帮助研究员快速梳理行业脉络，制作产业链图谱；甚至基于历史模式识别潜在投资机会和风险。国金证券提出的”AI+RPA”模式中，RPA像强有力的机械手臂自动执行任务，AIGC则是机械大脑进行分析、整合、创造，两者结合可自动化处理研究分析中的重复和繁琐任务。

风险管理与合规监控是大模型在证券行业的关键应用。金融市场波动大、监管要求复杂，传统风控系统主要依赖规则引擎，难以应对新型风险。大模型可分析交易模式、网络舆情和市场数据，识别潜在异常；实时监控客户交流内容，标记可能违规的对话；自动生成合规报告，减少人工工作量。大模型在反洗钱、内幕交易监控等方面也表现出色，能发现传统系统忽略的隐蔽关联模式。某证券公司的应用实践表明，大模型可将合规审查效率提升40%以上，同时提高风险识别准确率。

内部知识管理与运营自动化是大模型提升证券企业效率的重要应用。证券公司积累了大量内部知识资产，但分散在不同系统和文档中。大模型可作为统一的知识中枢，帮助员工快速定位专业资料、业务规程和历史案例；自动生成会议纪要、操作指引和培训材料；甚至辅助编写代码和业务脚本。国金证券推动大模型与现有系统分级耦合并成为AI中台建设的突破口，为不同部门提供智能化支持。大模型与RPA结合还能自动化处理财务对账、报表生成等后台运营工作，显著降低运营成本。