数据采集与融合技术2021 (福州大学)

  • 数据挖掘第一次作业

    作业① 1) – 要求:用urllib和re库方法定向爬取给定网址(https://www.shanghairanking.cn/rankings/bcsr/2020/0812 )的数据。 – 输出信息: 2020排名 2019排名 全部层次 学校类型 总分 1 2 前2% 中国人民大学 1069.
    好的了解了啊!   2021-09-29 22:04   0   61
  • 【数据采集与融合】第一次实验

    一、作业一 要求:使用用urllib和re库方法定向爬取给定网址中国最好学科排名(计算机科学与技术)的数据。 输出形式: 2020排名全部层次学校类型总分 1 前2% 中国人民大学 1069.0 2 .... ........... ...... 作业一实现如下: 1.1 使用urllib.requ
    cowhorse   2021-09-29 21:39   0   41
  • 【数据采集与融合技术】 第一次大作业

    一、作业① 要求:用urllib和re库方法定向爬取给定网址(https://www.shanghairanking.cn/rankings/bcsr/2020/0812 )的数据。 输出信息: 2020排名 全部层次 大学 总分 1 前2% 清华大学 1661.0 2 ... 1、思路、代码和实验
    暴走大可可   2021-09-29 21:10   0   80
  • 第一次实践

    #作业① ##1)要求: ###用urllib和re库方法定向爬取给定网址(https://www.shanghairanking.cn/rankings/bcsr/2020/0812 )的数据。 ###输出信息: 2020排名|全部层次|学校类型|总分 : :|: :|: :|: : 1|前2%|
    Flyme10086   2021-09-29 20:48   0   42
  • 「数据采集」实验一

    ##一、作业① **要求:**用urllib和re库方法定向爬取给定网址中国最好学科排名(计算机科学与技术)的数据。 输出形式: 2020排名 全部层次 学校类型 总分 1 前2% 中国人民大学 1069.0 2 .... ........... ...... ###1.获取网页源码:getHTML
    Sevennnn   2021-09-29 15:56   0   154
  • 【数据采集】第一次实验

    1. 作业① 1.1 题目 用urllib和re库方法定向爬取给定网址的数据 1.2 思路 1.2.1 发送请求 引入库并且编写请求头 请求头是为了把爬虫包装成浏览器的正常访问。 import urllib.request import re header = { 'user-agent': 'Mo
    FanOne   2021-09-29 14:00   0   126
  • 数据采集第一次作业(2022)

    作业1: 题目:要求用urllib和re库方法定向爬取给定网址2020中国最好学科排名的数据。输出信息如下: 2020排名 全部层次 学校类型 总分 1 前2% 中国人民大学 1069.0 2 ... ... ... 解题: url="https://www.shanghairanking.cn/r
    ハレハレヤ   2020-10-03 10:33   0   58