当前位置：首页 > news >正文

渭南市网站建设_网站建设公司_服务器部署_seo优化

news 2026/1/16 7:05:06

做网站设备,90设计网站怎么绑定手机号,网站建设高端品牌,网站反链有好处吗多线程工作原理多线程示意图 Queue#xff08;队列对象#xff09; queue是python中的标准库#xff0c;可以直接from queue import Queue引用;队列是线程间最常用的交换数据的形式 python下多线程的思考对于资源#xff0c;加锁是个重要的环节。Queue#xff0c;是线…多线程工作原理多线程示意图 Queue队列对象 queue是python中的标准库可以直接from queue import Queue引用;队列是线程间最常用的交换数据的形式 python下多线程的思考对于资源加锁是个重要的环节。Queue是线程安全的因此在满足使用条件下建议使用队列创建一个“队列”对象 pageQueue Queue(10) 将一个值放入队列中 for page in range(1, 11): pageQueue.put(page) 将一个值从队列中取出 pageQueue.get() 队列Queue Queue线程安全 queue是python中的标准库可以直接from queue import Queue引用;队列是线程间最常用的交换数据的形式创建一个“队列”对象队列常用方法 put() get(block) empty() full() qsize() 队列锁与线程锁 import threading from queue import Queue dataQueue Queue(100) exitFlag Falseclass MyThread(threading.Thread):def __init__(self,q):super().__init__()self.queue qdef run(self):super().run()global exitFlagwhile True:if exitFlag:print(exit)breaktry:print(------------------------,self.queue.get(False))self.queue.task_done()except:passdef main():for i in range(100):dataQueue.put(i)threads []for i in range(5):thread MyThread(dataQueue)threads.append(thread)thread.start()# 队列锁# dataQueue.join()global exitFlagexitFlag Trueprint(exit ------------------------------------------------)# 线程锁for t in threads:t.join()if __name__ __main__:main()另一个实例爬去读书网站 import requests from bs4 import BeautifulSoup from queue import Queue import threading from threading import Lock url https://www.dushu.com/book/1175_%d.html task_queue Queue(100) parse_queue Queue(100) headers {Accept:text/html,application/xhtmlxml,application/xml;q0.9,image/webp,image/apng,*/*;q0.8,application/signed-exchange;vb3, Accept-Encoding:gzip, deflate, br, Accept-Language:zh-CN,zh;q0.9, Cache-Control:max-age0, Connection:keep-alive, Cookie:Hm_lvt_8008bbd51b8bc504162e1a61c3741a9d1572418328; Hm_lpvt_8008bbd51b8bc504162e1a61c3741a9d1572418390, Host:www.dushu.com, Sec-Fetch-Mode:navigate, Sec-Fetch-Site:none, Sec-Fetch-User:?1, Upgrade-Insecure-Requests:1, User-Agent:Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.70 Safari/537.36,} # 解析线程退出的标记 exit_flag False# 相当于线程池 class CrawlThread(threading.Thread):def __init__(self, q_task:Queue,q_parse:Queue) - None:super().__init__()self.q_task q_taskself.q_parse q_parsedef run(self) - None:super().run()self.spider()# 一直干活def spider(self):while True:if self.q_task.empty():print(爬虫线程%s执行任务结束%(threading.current_thread().getName()))breaktaskId self.q_task.get()response requests.get(url % (taskId), headers headers)response.encoding utf-8html response.textself.q_parse.put((html,taskId))self.q_task.task_done()print(------爬虫线程%s-----执行任务:%d-------%(threading.current_thread().getName(),taskId)) # 专心爬虫 def crawl():for i in range(1,101):task_queue.put(i)for i in range(5):t CrawlThread(task_queue,parse_queue)t.start()class ParseThread(threading.Thread):def __init__(self,q_parse:Queue,lock:Lock,fp):super().__init__()self.q_parse q_parseself.lock lockself.fp fpdef run(self):super().run()self.parse()def parse(self):while True:if exit_flag:print(-----------解析线程%s完成任务退出------------%(threading.current_thread().getName()))breaktry:html,taskId self.q_parse.get(blockFalse)soup BeautifulSoup(html,lxml)books soup.select(div[classbookslist] ul li)print(----------------,len(books))for book in books:self.lock.acquire()book_url book.find(img).attrs[src]book_title book.select(h3 a)[0][title]book_author book.select(p)[0].get_text()book_describe book.select(p)[1].get_text()fp.write(%s\t%s\t%s\t%s\n%(book_url,book_title,book_author,book_describe))self.lock.release()self.q_parse.task_done()print(**********解析线程%s完成了第%d页解析任务***********%(threading.current_thread().getName(),taskId))except :pass # 专心的负责网页解析保存 def parse(fp):lock Lock()for i in range(5):t ParseThread(parse_queue,lock,fp)t.start() if __name__ __main__:crawl()fp open(./book.txt,a,encodingutf-8)parse(fp)# 队列join队列中的任务必须结束下面才会执行task_queue.join()parse_queue.join()fp.close()exit_flag Trueprint(代码执行到这里) 多线程实现读书http://www.qwsy.com/shuku.aspx?page1 导包定义变量创建爬虫线程并启动爬虫线程创建解析线程并启动解析线程 Queue.get(block True/False) join()锁定线程确保线程全部执行完毕结束任务

查看全文

http://www.ihoyoo.com/news/39208.html