|
|
|
# LeetCode 讨论数据采集需求
|
|
|
|
## 网站描述
|
|
|
|
|
|
|
|
[LeetCode](https://leetcode.com/) 是一个在线编程练习网站。登陆网站后,点击上方 Problems,即可进入试题列表:
|
|
|
|
![image](uploads/8e48a9a06aca28ed3d25d4568b6e1f08/image.png)
|
|
|
|
|
|
|
|
点击任意题目即可进入做题页面:
|
|
|
|
![image](uploads/9c1f6f049491071176547cf19e1e7a55/image.png)
|
|
|
|
|
|
|
|
做题页面可以看到题解和网友讨论:
|
|
|
|
![image](uploads/808e8d0a894563bfe69160bb95171f08/image.png)
|
|
|
|
|
|
|
|
![image](uploads/7d622c279b59043f6dec5bb34a163f7d/image.png)
|
|
|
|
|
|
|
|
## 采集需求
|
|
|
|
本任务要求采集LeetCode全部公开题目的讨论。
|
|
|
|
|
|
|
|
## 数据格式
|
|
|
|
|
|
|
|
```javascript
|
|
|
|
// topics
|
|
|
|
[
|
|
|
|
{
|
|
|
|
"questionId": 135 // 问题 ID
|
|
|
|
"topicId": 42770, // 讨论 ID
|
|
|
|
"title": "One-pass constant space Java solution", // 标题
|
|
|
|
"viewCount": 17224, // 浏览量
|
|
|
|
"tags": [ "java" ],
|
|
|
|
"post": 83974 // 内容 ID
|
|
|
|
},
|
|
|
|
...
|
|
|
|
]
|
|
|
|
|
|
|
|
// posts
|
|
|
|
[
|
|
|
|
{
|
|
|
|
"parent": -1, // 评论对象(-1表示顶级评论)
|
|
|
|
"id": 83974, // ID
|
|
|
|
"content": "Hi guys!\\n\\nThis solution ...", // 内容
|
|
|
|
"voteCount": 115, // 好评数
|
|
|
|
"creationDate": 1422730230, // 创建时间
|
|
|
|
"updationDate": 1539548852, // 修改时间
|
|
|
|
"author": "shpolsky" // 作者 ID
|
|
|
|
"authorReputation": 2772, // 作者声望
|
|
|
|
},
|
|
|
|
{
|
|
|
|
"parent": 83974, // 评论对象
|
|
|
|
"id": 320419, // ID
|
|
|
|
"content": "Same idea but easier version ...", // 内容
|
|
|
|
"voteCount": 115, // 好评数
|
|
|
|
"creationDate": 1422730230, // 创建时间
|
|
|
|
"updationDate": 1539548852, // 修改时间
|
|
|
|
"author": "shpolsky" // 作者 ID
|
|
|
|
"authorReputation": 2772, // 作者声望
|
|
|
|
},
|
|
|
|
...
|
|
|
|
]
|
|
|
|
```
|
|
|
|
|
|
|
|
## 评分标准
|
|
|
|
* 采集到所有题目的一级评论内容:1分
|
|
|
|
* 采集到所有题目的各级评论:2分
|
|
|
|
* 各级评论包含完整的树状结构:3分 |
|
|
|
\ No newline at end of file |