Categories


Tags


用python语言写一个采集程序,用户输入城市名和采集数量,程序根据用户输入项,采集所在城市的公司信息,信息包括公司名、地址、电话、网址、邮箱、法人和经营范围。程序需要注释。

  用python语言写一个采集程序,用户输入城市名和采集数量,程序根据用户输入项,采集所在城市的公司信息,信息包括公司名、地址、电话、网址、邮箱、法人和经营范围。程序需要注释。

整理自网络ChatGPT产生之内容,文本内容不具备参考意义,程序内容及代码片段有且仅有借鉴意义。

   

请参考下面的代码:

# coding:utf-8

# 引入需要的第三方模块
import requests 
import re 

# 用户输入城市名和采集数量
city = input('请输入您要查询的城市:')
number = input('请输入您要获取的公司数量:')

# 定义要采集的url
url = 'http://www.qichacha.com/search?key={}'.format(city)

# 发送请求获取相应数据
response = requests.get(url).text
# 通过正则提取需要的公司信息
companies = re.findall('', response, re.S)
# 初始化一个用来存储公司信息的字典
result = []
# 遍历提取的信息
for each in companies[1:int(number)+1]:
  # 提取公司名
  name = re.findall('data-register_no="(.*?)">', each, re.S)[0]
  # 提取公司地址
  address = re.findall('data-register_capital="(.*?)"', each, re.S)[0]
  # 提取公司电话
  tel = re.findall('(.*?)\s*?', each, re.S)[0]
  # 提取公司法人
  legal_person = re.findall('="_blank">(.*?)\s*?(.*?)\s*?', each, re.S)[0]  
  # 将采集的所有信息放入一个字典中
  data = {"name":name, "address":address, "tel":tel, 
          "website":website, "email":email, 
          "legal_person":legal_person, "business_scope":business_scope}
  # 将所有信息的字典放入一个大的字典
  result.append(data)
  
# 打印采集结果
for each in result:
  print(each)

Public @ 2023-02-18 13:12:04 整理自网络ChatGPT产生之内容,文本内容不具备参考意义,程序内容有且仅有借鉴意义。

更多您感兴趣的搜索