|
|
# 快速问医生-疾病
|
|
|
## 网站描述
|
|
|
[快速问医生](http://tag.120ask.com)是一个医疗信息百科网站,主要有疾病、症状、检查、手术、药品五类信息。通过网站右上角的资料卡片,可以进入每类信息的专题页面。本实验的目标是采集[疾病库](http://tag.120ask.com/jibing/)的数据。
|
|
|
|
|
|
## 疾病需求
|
|
|
可用遍历拼音、遍历部位和遍历科室三种思路得到所有疾病的页面。
|
|
|
|
|
|
拼音: http://tag.120ask.com/jibing/pinyin/a.html
|
|
|
|
|
|
部位: http://tag.120ask.com/jibing/buwei/toubu
|
|
|
|
|
|
科室: http://tag.120ask.com/jibing/ks/nk.html
|
|
|
|
|
|
对于某个疾病的页面,我们需要以下信息:
|
|
|
|
|
|
疾病名称、疾病简介、绿色框内的所有信息、疾病概况中的所有信息、相关症状、推荐药品
|
|
|
|
|
|
## 数据格式
|
|
|
采集得到的数据要求为`json`格式,要求的字段及描述如下:
|
|
|
```javascript
|
|
|
|
|
|
[
|
|
|
{
|
|
|
类型: "疾病",
|
|
|
网址: "http://xxx...",
|
|
|
名称: "xx",
|
|
|
简介: "xxx",
|
|
|
属性: { //包括绿色框和疾病概况的内容
|
|
|
挂什么科: "",
|
|
|
哪些症状: "",
|
|
|
...
|
|
|
治疗周期: "",
|
|
|
饮食宜:"",
|
|
|
饮食忌: "",
|
|
|
病因: "",
|
|
|
症状: "",
|
|
|
...
|
|
|
饮食: ""
|
|
|
},
|
|
|
相关症状: [
|
|
|
{名称: "aaa", 网址: ""},
|
|
|
{名称: "bbb", 网址: ""},
|
|
|
...
|
|
|
],
|
|
|
推荐药品: [
|
|
|
{名称: "ccc", 网址: ""},
|
|
|
{名称: "ddd", 网址: ""},
|
|
|
...
|
|
|
]
|
|
|
}
|
|
|
]
|
|
|
```
|
|
|
## 评分标准
|
|
|
* 采集到100个页面的全部域:1分
|
|
|
* 采集到网站全部页面:2分 |
|
|
\ No newline at end of file |