anime-downloader/anime_downloader/downloader/base_downloader.py

import os
import time
import logging
import sys

from anime_downloader import util
from anime_downloader import session

import requests

logger = logging.getLogger(__name__)


class BaseDownloader:
    def __init__(self, source, path, force, range_size, callback=None):
        self.chunksize = 16384
        self._total_size = None
        self.source = source
        self.path = path

        # these should be included in a options dict, maybe
        self.force = force
        self.range_size = range_size

        if callback is None:
            callback = write_status
        self.callback = callback

    def check_if_exists(self):
        # Added Referer Header as kwik needd it.
        headers = self.source.headers
        if 'user-agent' not in headers:
            headers['user-agent'] = "Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:88.0.1) Gecko/20100101 Firefox/88.0.1"

        if self.source.referer:
            headers['referer'] = self.source.referer

        # I couldn't figure out how to retry based on headers with httpadapter.
        for i in range(5):
            with requests.get(self.source.stream_url, headers=headers, stream=True, verify=False) as r:
                self._total_size = max(int(r.headers.get('Content-length', 0)),
                                       int(r.headers.get('Content-Length', 0)),
                                       int(r.headers.get('content-length', 0)))
                if not self._total_size and not r.headers.get('Transfer-Encoding') == 'chunked':
                    continue

                if os.path.exists(self.path):
                    if abs(os.stat(self.path).st_size - self._total_size) < 10 \
                       and not self.force:
                        logger.warning('File already downloaded. Skipping download.')
                        return True
                    else:
                        # NOTE: Unknown size assumes no mismatch and will redownload the file.
                        if not abs(os.stat(self.path).st_size - self._total_size) < 10 and self._total_size != 0:
                            logger.error('Total size mismatch ({} and {}), the file already downloaded probably comes from a different source.'.format(
                                         self._total_size, abs(os.stat(self.path).st_size)))
                            sys.exit(1)

        logger.debug('Total size: ' + str(self._total_size))

    def download(self):
        # TODO: Clean this up
        self.pre_process()
        logger.info(self.path)

        # TODO: Use pathlib. Break into functions
        util.make_dir(self.path.rsplit('/', 1)[0])
        if self.check_if_exists():
            return

        self.start_time = time.time()
        self.downloaded = 0
        self._download()
        self.post_process()

    def _download(self):
        raise NotImplementedError

    def pre_process(self):
        pass

    def post_process(self):
        pass

    def report_chunk_downloaded(self):
        self.downloaded += self.chunksize
        self.callback(self.downloaded, self._total_size, self.start_time)


def write_status(downloaded, total_size, start_time):
    elapsed_time = time.time() - start_time
    rate = (downloaded / 1024) / elapsed_time if elapsed_time else 'x'
    downloaded = float(downloaded) / 1048576
    total_size = float(total_size) / 1048576

    status = 'Downloaded: {0:.2f}MB/{1:.2f}MB, Rate: {2:.2f}KB/s'.format(
        downloaded, total_size, rate)

    sys.stdout.write("\r" + status + " " * 5 + "\r")
    sys.stdout.flush()
yohoo. Downloader refractor 2018-07-27 11:52:21 -07:00			`import os`
			`import time`
			`import logging`
			`import sys`

			`from anime_downloader import util`
Remove unused imports, enclose session into function 2018-10-14 23:41:15 -07:00			`from anime_downloader import session`
yohoo. Downloader refractor 2018-07-27 11:52:21 -07:00
somewhat fixed internal downloader now it won't 'freeze' like before 2020-08-26 07:33:27 -07:00			`import requests`

chore: logging replaced with logger, style 2019-03-22 06:47:00 -07:00			`logger = logging.getLogger(__name__)`

yohoo. Downloader refractor 2018-07-27 11:52:21 -07:00
			`class BaseDownloader:`
fix: fix the internal downloader 2020-03-27 06:50:08 -07:00			`def __init__(self, source, path, force, range_size, callback=None):`
yohoo. Downloader refractor 2018-07-27 11:52:21 -07:00			`self.chunksize = 16384`
feat: Add server switching for 9anime 2019-05-22 10:04:27 -07:00			`self._total_size = None`
fix: fix the internal downloader 2020-03-27 06:50:08 -07:00			`self.source = source`
			`self.path = path`

			`# these should be included in a options dict, maybe`
			`self.force = force`
			`self.range_size = range_size`

			`if callback is None:`
			`callback = write_status`
			`self.callback = callback`
yohoo. Downloader refractor 2018-07-27 11:52:21 -07:00
fix: get everything to working state 2019-05-08 11:17:30 -07:00			`def check_if_exists(self):`
chore: logging replaced with logger, style 2019-03-22 06:47:00 -07:00			`# Added Referer Header as kwik needd it.`
Allowing for headers to be passed to downloader and fixed 4anime (#494) * Update _4anime.py * Update anime.py * Update base_extractor.py * Update http_downloader.py * Update base_downloader.py * Update util.py 2020-08-27 05:08:11 -07:00			`headers = self.source.headers`
			`if 'user-agent' not in headers:`
Update user-agents 2021-05-23 13:50:55 -07:00			`headers['user-agent'] = "Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:88.0.1) Gecko/20100101 Firefox/88.0.1"`
Allowing for headers to be passed to downloader and fixed 4anime (#494) * Update _4anime.py * Update anime.py * Update base_extractor.py * Update http_downloader.py * Update base_downloader.py * Update util.py 2020-08-27 05:08:11 -07:00
fix: fix the internal downloader 2020-03-27 06:50:08 -07:00			`if self.source.referer:`
			`headers['referer'] = self.source.referer`
somewhat fixed internal downloader now it won't 'freeze' like before 2020-08-26 07:33:27 -07:00
fixing content-range (anime dl "Neverland" -xd "" -e 4) 2020-09-13 07:36:27 -07:00			`# I couldn't figure out how to retry based on headers with httpadapter.`
			`for i in range(5):`
			`with requests.get(self.source.stream_url, headers=headers, stream=True, verify=False) as r:`
			`self._total_size = max(int(r.headers.get('Content-length', 0)),`
			`int(r.headers.get('Content-Length', 0)),`
			`int(r.headers.get('content-length', 0)))`
			`if not self._total_size and not r.headers.get('Transfer-Encoding') == 'chunked':`
			`continue`

			`if os.path.exists(self.path):`
			`if abs(os.stat(self.path).st_size - self._total_size) < 10 \`
			`and not self.force:`
			`logger.warning('File already downloaded. Skipping download.')`
			`return True`
			`else:`
			`# NOTE: Unknown size assumes no mismatch and will redownload the file.`
			`if not abs(os.stat(self.path).st_size - self._total_size) < 10 and self._total_size != 0:`
			`logger.error('Total size mismatch ({} and {}), the file already downloaded probably comes from a different source.'.format(`
			`self._total_size, abs(os.stat(self.path).st_size)))`
			`sys.exit(1)`

			`logger.debug('Total size: ' + str(self._total_size))`
yohoo. Downloader refractor 2018-07-27 11:52:21 -07:00
fix: fix the internal downloader 2020-03-27 06:50:08 -07:00			`def download(self):`
feat: Add server switching for 9anime 2019-05-22 10:04:27 -07:00			`# TODO: Clean this up`
yohoo. Downloader refractor 2018-07-27 11:52:21 -07:00			`self.pre_process()`
fix: fix the internal downloader 2020-03-27 06:50:08 -07:00			`logger.info(self.path)`
fix: get everything to working state 2019-05-08 11:17:30 -07:00
			`# TODO: Use pathlib. Break into functions`
fix: fix the internal downloader 2020-03-27 06:50:08 -07:00			`util.make_dir(self.path.rsplit('/', 1)[0])`
fixing content-range (anime dl "Neverland" -xd "" -e 4) 2020-09-13 07:36:27 -07:00			`if self.check_if_exists():`
			`return`
yohoo. Downloader refractor 2018-07-27 11:52:21 -07:00
			`self.start_time = time.time()`
			`self.downloaded = 0`
			`self._download()`
			`self.post_process()`

			`def _download(self):`
			`raise NotImplementedError`

			`def pre_process(self):`
			`pass`

			`def post_process(self):`
			`pass`

			`def report_chunk_downloaded(self):`
			`self.downloaded += self.chunksize`
fix: fix the internal downloader 2020-03-27 06:50:08 -07:00			`self.callback(self.downloaded, self._total_size, self.start_time)`
yohoo. Downloader refractor 2018-07-27 11:52:21 -07:00

			`def write_status(downloaded, total_size, start_time):`
fixing content-range (anime dl "Neverland" -xd "" -e 4) 2020-09-13 07:36:27 -07:00			`elapsed_time = time.time() - start_time`
			`rate = (downloaded / 1024) / elapsed_time if elapsed_time else 'x'`
			`downloaded = float(downloaded) / 1048576`
			`total_size = float(total_size) / 1048576`
yohoo. Downloader refractor 2018-07-27 11:52:21 -07:00
			`status = 'Downloaded: {0:.2f}MB/{1:.2f}MB, Rate: {2:.2f}KB/s'.format(`
			`downloaded, total_size, rate)`

fixing content-range (anime dl "Neverland" -xd "" -e 4) 2020-09-13 07:36:27 -07:00			`sys.stdout.write("\r" + status + " " * 5 + "\r")`
yohoo. Downloader refractor 2018-07-27 11:52:21 -07:00			`sys.stdout.flush()`