helper.webFile module
webファイルのヘルパー
課題
docstringを整える
- class helper.webFile.WebFile(value_object: WebFileValue = None, download_file_name: str = None, start_ext: str = '.jpg', download_path: str = 'D:/git/igaponr/training/python/Web_scraping/helper/../download')[ソース]
ベースクラス:
objectwebファイルのヘルパー
- download_file_name: str = None
- download_path: str = 'D:/git/igaponr/training/python/Web_scraping/helper/../download'
- ext_dict: dict = {'.gif': ['.gif', '.jpg', '.png', '.webp'], '.jpg': ['.jpg', '.png', '.gif', '.webp'], '.png': ['.png', '.jpg', '.gif', '.webp'], '.webp': ['.webp', '.jpg', '.png', '.gif']}
- ext_list: list = ['.jpg', '.png', '.gif', '.webp']
- static fixed_file_name(file_name: str) str[ソース]
ファイル名の禁止文字を全角文字に置き換える :param file_name: str 置き換えたいファイル名 :return: str 置き換え後のファイル名
- static fixed_path(file_path: str) str[ソース]
フォルダ名の禁止文字を全角文字に置き換える :param file_path: str 置き換えたいフォルダパス :return: str 置き換え後のフォルダパス
- get_deployment_url_list()[ソース]
ナンバリングされたURLであれば、数字部分を末尾とした、URL展開してURLリスト=url_listを作る TODO: ナンバリングのチェック、1000以上ならエラーにするなど :return: list 展開した画像URLリスト
- get_image_content_by_requests(timeout=30)[ソース]
requestsを用いて、imageのコンテンツを取得する。 サーバー落ちているとリダイレクトでエラー画像になることがあるのでリダイレクトFalse :param timeout: int タイムアウト時間[s] :return: bytes 読み込んだimageのバイナリデータ
- rename_filename(new_file_name)[ソース]
dst_filenameに設定して、ローカルにあるファイルのファイル名も変更する TODO: dst_file_nameにセットするときは、download_file_nameでvalue_objectを作り直すべきか :param new_file_name: str 変更する新しいファイル名 :return: bool True/False=変更(した/しなかった)
- rename_url_ext_shift()[ソース]
urlの画像拡張子を、ext_listの次の拡張子にシフトする 現在の拡張子はext_listの何番目か調べて、次の拡張子にurlを変更して、値オブジェクトを作り直す :return:
- start_ext: str = '.jpg'
- value_object: WebFileValue = None
- class helper.webFile.WebFileValue(url: Uri = None, download_file_name: str = None, start_ext: str = '.jpg', download_path: str = 'D:/git/igaponr/training/python/Web_scraping/helper/../download')[ソース]
ベースクラス:
objectwebファイルヘルパー値オブジェクト
- download_file_name: str = None
- download_path: str = 'D:/git/igaponr/training/python/Web_scraping/helper/../download'
- start_ext: str = '.jpg'
- url: Uri = None