helper.scraping module

スクレイピングユーティリティ
  • サイトURLと、selectorsを指定して、スクレイピングする

課題

  • docstringを整える

class helper.scraping.Scraping(value_object=None, selectors=None)[ソース]

ベースクラス: object

スクレイピングのユーティリティ

clip_copy()[ソース]

クローリング結果をクリップボードにコピーする :return: bool 成功/失敗=True/False

create_save_text()[ソース]

保存用文字列の作成 :return: str 保存用文字列の作成

get_value_object()[ソース]

値オブジェクトを取得する

load_pickle(load_path)[ソース]

pickleファイルを読み込み、デシリアライズする :param load_path: str ロードするpickleファイルのパス :return: bool 成功/失敗=True/False

load_text(load_path)[ソース]

独自フォーマットなファイルからデータを読み込む :param load_path: str ロードする独自フォーマットなファイルのパス :return: bool 成功/失敗=True/False

save_pickle(save_path)[ソース]

シリアライズしてpickleファイルに保存する :param save_path: str セーブするpickleファイルのパス :return: bool 成功/失敗=True/False

save_text(save_path)[ソース]
データをファイルに、以下の独自フォーマットで保存する
  • サイトURL

  • セレクタ

パラメータ:

save_path -- str セーブする独自フォーマットなファイルのパス

戻り値:

bool 成功/失敗=True/False

scraping_chrome_driver()[ソース]

TODO: ChromeDriverから、dictでスクレイピング結果を受け取りたい :return:

value_object: ScrapingValue = None
class helper.scraping.ScrapingValue(site_url, selectors)[ソース]

ベースクラス: object

値オブジェクト

selectors: dict = None
site_url: str = None