|
|
|
# 美团数据采集需求
|
|
|
|
## 任务要求
|
|
|
|
爬取合肥市所有美食类商家评论信息。
|
|
|
|
|
|
|
|
进入美团官网后,选择美食栏目,可以看到不同的分类以及区域。对不同的分类以及区域爬取所有的商家信息。
|
|
|
|
![image](uploads/9d4d9d13b86a43c1c663035178507f64/image.png)
|
|
|
|
爬取商家的基本信息,以及所有的网友点评信息。包含评论用户昵称,头像,评论文本,附加图片,评论日期以及商家回复。
|
|
|
|
|
|
|
|
|
|
|
|
## 数据格式
|
|
|
|
采集得到的数据要求为 json 格式,要求的字段及描述如下:
|
|
|
|
```javascript
|
|
|
|
[
|
|
|
|
{
|
|
|
|
id: // 商铺ID
|
|
|
|
name: // 商铺名称
|
|
|
|
category: // 分类
|
|
|
|
region: // xx区-xx商业区
|
|
|
|
address: // 地址
|
|
|
|
comment_count: // 评论总数
|
|
|
|
comments: [ // 评论列表
|
|
|
|
{
|
|
|
|
person_name: // 评论者名字
|
|
|
|
person_avatar: // 头像url
|
|
|
|
date: // 评论日期
|
|
|
|
star: // 几星
|
|
|
|
description: // 具体评论文本
|
|
|
|
attached_imgs[] // 评论图片url列表
|
|
|
|
reply: // 商家回复文本
|
|
|
|
},
|
|
|
|
...
|
|
|
|
],
|
|
|
|
},
|
|
|
|
...
|
|
|
|
]
|
|
|
|
```
|
|
|
|
|
|
|
|
评分标准
|
|
|
|
* 采集到某城市所有的商家信息:1分
|
|
|
|
* 采集到某城市所有的商家信息与店铺评论信息:2分
|
|
|
|
* 采集到某城市所有的商家信息与店铺评论+图片信息:3分 |