Skip to content
GitLab
  • Menu
Projects Groups Snippets
  • /
  • Help
    • Help
    • Support
    • Community forum
    • Submit feedback
  • Sign in / Register
  • D data-specification
  • Project information
    • Project information
    • Activity
    • Labels
    • Members
  • Issues 0
    • Issues 0
    • List
    • Boards
    • Service Desk
    • Milestones
  • Packages & Registries
    • Packages & Registries
    • Package Registry
    • Infrastructure Registry
  • Monitor
    • Monitor
    • Incidents
  • Analytics
    • Analytics
    • Value stream
  • Wiki
    • Wiki
  • Snippets
    • Snippets
  • Activity
  • Create a new issue
  • Issue Boards
Collapse sidebar
  • Yu Yin
  • data-specification
  • Wiki
  • 快速问医生 疾病

快速问医生 疾病 · Changes

Page history
Update 快速问医生 疾病 authored Oct 22, 2019 by Le Dai's avatar Le Dai
Show whitespace changes
Inline Side-by-side
快速问医生-疾病.md
View page @ 4e6ac119
# 快速问医生-疾病
## 网站描述
[快速问医生](http://tag.120ask.com)是一个医疗信息百科网站,主要有疾病、症状、检查、手术、药品五类信息。通过网站右上角的资料卡片,可以进入每类信息的专题页面。本实验的目标是采集[疾病库](http://tag.120ask.com/jibing/)的数据。
## 疾病需求
可用遍历拼音、遍历部位和遍历科室三种思路得到所有疾病的页面。
拼音: http://tag.120ask.com/jibing/pinyin/a.html
部位: http://tag.120ask.com/jibing/buwei/toubu
科室: http://tag.120ask.com/jibing/ks/nk.html
对于某个疾病的页面,我们需要以下信息:
疾病名称、疾病简介、绿色框内的所有信息、疾病概况中的所有信息、相关症状、推荐药品
## 数据格式
采集得到的数据要求为`json`格式,要求的字段及描述如下:
```javascript
[
{
类型: "疾病",
网址: "http://xxx...",
名称: "xx",
简介: "xxx",
属性: { //包括绿色框和疾病概况的内容
挂什么科: "",
哪些症状: "",
...
治疗周期: "",
饮食宜:"",
饮食忌: "",
病因: "",
症状: "",
...
饮食: ""
},
相关症状: [
{名称: "aaa", 网址: ""},
{名称: "bbb", 网址: ""},
...
],
推荐药品: [
{名称: "ccc", 网址: ""},
{名称: "ddd", 网址: ""},
...
]
}
]
```
## 评分标准
* 采集到100个页面的全部域:1分
* 采集到网站全部页面:2分
\ No newline at end of file
Clone repository
  • 39健康网 手术
  • 39健康网 检查
  • 39健康网 疾病
  • 39健康网 症状
  • 39健康网 药品
  • Coursera 视频间习题2
  • KDD 接收论文信息
  • LeetCode 中文讨论
  • LeetCode 中文试题
  • LeetCode 讨论
  • LeetCode 试题
  • Leetcode 题解
  • coursera
  • Home
  • 中国裁判文书网
View All Pages