忍者ブログ

オナ禁始めました。

VIPでテキストサイト

【253日終了】

×

[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。



コメント

ただいまコメントを受けつけておりません。

【253日終了】

寒いね。寒いよマジで。こんな寒いとクレーンゲームしにゲームセンターまで歩いていけないよお。そういえばこの前、サングラス掛けたピカチュウのぬいぐるみを300円で仕留められてご満悦です。もう冬なのにまだサングラス掛けてるピカチュウ残ってるのは在庫処分のタイミングをミスりましたね。たぶんサービス台みたいな感じかな。

昨日ね、ずっとほったらかしにしてたpythonしようと思ってね。まあでもpythonしたから何かできるの?って感じだから全然やる気が起きなくてプログラミングとかしてなかったんだけど試しにwebスクレイピングって言うwebの情報を収集できるっていうことができるらしいからやってみたの。そしたらなんかできた。
https://www.hellowork.mhlw.go.jp/index.html
とりまハロワのトップページでdivタグだけを取り出してメモ帳に書き込ませて保存させるって言うのしてみたらできた。
import requests
from bs4 import BeautifulSoup
# URL指定
url = "https://www.hellowork.mhlw.go.jp/index.html"
# Responseオブジェクト生成
response = requests.get('https://www.hellowork.mhlw.go.jp/index.html')
# 文字化け防止
response.encoding = response.apparent_encoding
# BeautifulSoupオブジェクト生成
soup = BeautifulSoup(response.text, "html.parser")
a = soup.div
with open('text.txt', mode='w', encoding = 'utf-8') as fw:
    for t in a:
        print(a.get_text())
        elm = a.get_text()
        fw.write(elm)

まあでもそしたら何かできたファイル見てみたら何回も同じこと書き込んだりしててよくわかんないんだけどとりあえず前進できたということで終わり。よくわからん。

PR

コメント

今回オナ禁を開始してから

プロフィール

HN:
さとー
性別:
男性