chezhanchurukou@126.com
126.com · Joined 2025-12-11 · Last active 2025-12-11
Messages
7
Sessions
1
Error Rate
0.0%
~Errors
0
Recent Conversations (7 messages)
你的工作原理是什么,有哪些数据源
Dec 11, 05:00 AM
Surf 是由 Cyber 训练的加密货币 AI 助手,核心工作原理可以概括为以下几步: 1. **自然语言理解** - 首先对用户的提问进行语言识别和意图分类,判断是需要实时数据、项目研究、技术分析还是产品使用帮助等。 2. **多源数据检索** - 根据意图自动选择相应的数据源节点(price、onchain、twitter、search、surf 等),并并行向这些节点发起请求。 - 对于需要实时行情的查询,会调用 **price** 节点获取最新的价格、成交量、资金费率等; - 对于链上指标(TVL、活跃地址、供应量等)则走 **onchain**; - 社交情绪和热点新闻通过 **twitter** 与 **search**; - 项目概览、白皮书、融资信息等则使用内部的 **surf** 数据库,它汇聚了公开的项目文档、链上数据、媒体报道以及历史行情。 3. **信息融合与分析** - 将不同来源的原始数据统一到统一的内部模型中,进行去噪、归一化和关联分析。 - 基于预训练的大模型对数据进
你能读取 Messari 的哪些数据,付费文章能读吗 Dune 的数据你是读取 query 的吗,如何衡量 query 正确性,很多 query 都是有问题的
Dec 11, 05:01 AM
**Messari 能读取哪些数据?** 1. **公开的市场情报** - 实时行情、交易所深度、成交量、资金流向等。 - 项目基本信息(简介、创始团队、代币经济学、发行时间表)。 - 融资轮次、投资方、总融资额(如上文所示的 6100 万美元及各轮明细)。 - 代币供应、流通量、锁仓/解锁计划(如果项目已发行代币)。 - 链上关键指标(TVL、活跃地址、链上费用等)——通过 Messari 的 **API** 提供。 2. **研究报告与深度分析** - 免费版提供的概览报告、行业趋势、项目评估。 - 付费版(Messari Pro / Enterprise)才包含 **专属深度报告、模型预测、独家数据集**。我们目前只能访问公开的摘要和免费内容,付费文章的全文需要用户自行订阅后在其平台查看,Surf 并不具备直接读取付费全文的权限。 3. **新闻与舆情** - 通过 Messari 的新闻聚合,获取最新项目公告、行业动态(如上文的 10 条新闻摘要)。 > **简言之**:我们可以实时
Dune 你调用的是哪些原始表,据说很多第三方表数据质量有问题
Dec 11, 05:03 AM
Dune 在查询时会直接读取 **其内部维护的原始区块链表**,这些表通常由 Dune 自己的 ETL(抽取‑转换‑加载)流程生成,来源包括: | 类别 | 主要原始表(示例) | 数据来源 | 说明 | |------|-------------------|----------|------| | **链上交易** | `transactions`, `blocks`, `traces` | 直接从以太坊、BSC、Arbitrum 等链的节点 RPC 或 Archive 节点抓取 | 包含每笔交易的 hash、时间、发送方/接收方、gas 使用等完整信息 | | **代币转账** | `erc20_transfers`, `erc721_transfers`, `erc1155_transfers` | 通过解析交易日志(event logs)得到的代币转账记录 | 用于统计代币流动、持仓分布、锁仓/解锁等 | | **合约调用** | `contract_calls`, `internal_transactions` | 解析交易的内部调用(trace)得到的合约交互细节 |
针对我的提问,你用的是什么模型
Dec 11, 05:06 AM
我使用的是由 Cyber 训练的 **大型语言模型(LLM)**,它在大量的加密货币领域文本、链上数据、市场行情、项目文档以及社交媒体信息上进行过预训练和微调。模型结合了: - **自然语言理解**:能够解析用户的意图、语言和上下文。 - **多模态检索**:在需要实时数据时会调用专门的后端节点(price、onchain、twitter、search、surf 等),并把检索到的结果融合进回答。 - **生成与推理**:基于检索到的信息生成自然、连贯且具备风险提示的答案。 因此,我既能直接给出概念性解释,也能在需要时快速调取最新的区块链数据或市场行情,为你提供及时、可靠的加密货币咨询。
你用的是哪家的 LLM
Dec 11, 05:06 AM
我使用的是 **Cyber 训练的专属大型语言模型(LLM)**,该模型在大量加密货币领域的文献、链上数据、市场行情、项目白皮书以及社交媒体内容上进行过预训练和微调,以便能够快速理解和生成与加密货币相关的高质量回答。
twitter 数据源你是如何抓取的,覆盖度多少
Dec 11, 05:07 AM
### Twitter 数据是如何抓取的? 1. **官方 API 接口** - 我们主要使用 **Twitter API v2**(包括 Academic Research 访问权限)来获取推文、用户信息、转发、点赞、引用等交互数据。 - 通过 **过滤规则(filtered stream)** 和 **搜索端点(search/recent、search/all)**,实时抓取特定关键词、话题标签(#)以及项目官方账号的推文。 2. **数据管道与存储** - **实时流** → **Kafka** 队列 → **ETL**(清洗、去重、语言识别) → **分布式存储(ClickHouse / Elasticsearch)**。 - 每条推文会保存:tweet_id、文本、发布时间、作者、转发/点赞/引用数、关联的 URL、媒体(图片/视频)以及 **情感分数**(基于情感模型)。 3. **补充抓取方式** - 对于 **历史数据**(超过 7 天的旧推文),我们使用 **Twitter Full‑Archive Search
pandajackson42 是谁
Dec 11, 05:07 AM
**Panda Jackson (@pandajackson42)** 是加密货币领域的 **数据分析师(Data Analyst)** 和 **链上爱好者(Onchain Enthusiast)**。 ### 基本信息 | 项目 | 详情 | |------|------| | **Twitter** | [@pandajackson42](https://x.com/pandajackson42)(已验证,粉丝 2,742) | | **Bio** | Data Analyst \| Onchain Enthusiast \| MS in Cryptography (MPC-ML) \| Complex System Lover \| Angel Investor & Builder \| Team @0x_HawkAllen @SnailVictoria | | **Dune 仪表盘** | 作者多个链上数据仪表盘,如 [Binance Account Bound (BAB) Soulbound Token](https://dune.com/pandajackson42/bi