فایل صورت سوال:
مواردی که ممکن است در این تمرین لازم شود:
- نصب pip در پایتون
- نصب Beautiful Soup بوسیله pip
- آموزش Beautiful Soup
- CSS Selector
- Regular Expression
مهلت تحویل: دوشنبه 95/2/6
طریقه تحویل: ایمیل به mmnematollahi+ie@gmail.com
#پی نوشت
کد استخراج id فیلمها از صفحه اول سایت:
import requestsfrom bs4 import BeautifulSoup as bsimport re_URL = 'http://cinematicket.org/'r = requests.get(_URL)soup = bs(r.text)soup = soup.select('.filmbox')[0]soup = soup.select('.con .margin a')ids = [int(re.findall('fid=(\d+)',x.attrs['href'])[0]) for x in soup]