本项目是基于 GitHub 和 Hugging Face 的活动数据,构建一个开源 AI 大模型生态分析与可视化平台。 通过多维度的数据分析和可视化展示,帮助开发者深入了解大模型生态系统的发展动态,为技术选型和生态分析提供有力支持。
• 在主页搜索框输入项目名称
• 从下拉列表选择目标项目
• 点击"分析"按钮开始分析
• 点击评分卡片查看详细指标
• 了解代码质量评分依据
• 分析社区活跃度数据
• 评估项目影响力表现
• 调整时间范围分析趋势
• 使用缩放工具查看细节
• 导出数据生成分析报告
• 点击导航栏"模型排行"进入
• 使用筛选器选择任务类型
• 按各项指标进行排序
• 搜索特定模型查看详情
• 点击"view"查看网络图
• 选择不同的视图模式:
- Top 100衍生模型
- 完整衍生关系
- 按作者分组视图
• 交互式探索网络关系
• 查看语言支持分布
• 分析作者影响力排名
• 了解组织类型分布
• 掌握任务类型热度
• OpenDigger 数据集
• Hugging Face API
• 网页爬虫
• Easy Graph 图计算
• 数据预处理流水线
• 增量数据更新
• Next.js 15 + React 19
• Material-UI 组件库
• ECharts 数据可视化
• PyVis 网络图
• Tailwind CSS
• 响应式设计
• Flask 框架
• 影响力算法
• RESTful API
• 数据预处理
• 缓存优化
• 性能监控
基于以下因素综合计算:
• 下载量(对数加权)
• 点赞数(线性加权)
• Space应用影响力
• 时间衰减因子
计算公式:
I_self = W₁·log(downloads) + W₂·likes + W₃·I_spaces + W₄·e^(-λt)
迭代计算三个部分:
• 自身影响力(α₁权重)
• 子模型影响力(α₂权重)
• 父模型影响力(α₃权重)
计算公式:
I_total = α₁·I_self + α₂·I_child + α₃·I_parent
• 模型元数据获取
- 基础信息采集
- 下载量统计
- 点赞数追踪
• 作者信息采集
- 个人/组织识别
- 影响力评估
• 衍生关系分析
- Model Tree 构建
- 关系类型识别
• 图数据处理
- 节点属性定义
- 边关系构建
- 图计算优化
• 影响力计算
- 自身影响力
- 关系传播
• 数据预处理
- 清洗与过滤
- 格式标准化
• 排行榜系统
- 多维度排序
- 实时更新
- 筛选功能
• 网络关系图
- 多视图切换
- 交互式探索
• 数据大屏
- 实时统计
- 趋势分析
• 扩大数据采集范围
• 增加历史数据分析
• 引入更多评估维度
• 优化数据更新机制
• 完善评分算法
• 增强可视化效果
• 提升用户交互体验
• 添加更多分析维度
• 支持更多开源平台
• 深化生态分析
• 开放数据接口
• 建立开发者社区