anime-downloader/anime_downloader/sites/animepahe.py

import logging
import re

from anime_downloader.sites.anime import AnimeEpisode, SearchResult, Anime
from anime_downloader.sites.exceptions import NotFoundError
from anime_downloader.sites import helpers

logger = logging.getLogger(__name__)


class AnimePahe(Anime, sitename='animepahe'):
    sitename = 'animepahe'
    api_url = 'https://animepahe.com/api'

    @classmethod
    def search(cls, query):
        params = {
            'l': 8,
            'm': 'search',
            'q': query
        }

        search_results = helpers.get(cls.api_url, params=params).json()
        if search_results['total'] == []:
            return []

        return [
            SearchResult(
                title=result['title'] + " (" + result['type'] + ")",
                url="https://animepahe.com/anime/TITLE!" + result['title'] + " (" + result['type'] + ")" + '!TITLE/' + result['session'] + "/" + str(result['id']),  # noqa
                poster=result['poster']
            )
            for result in search_results['data']
        ]

    def _scrape_episodes(self):
        attr = self.url.split('/')
        session = attr[-2]
        id_ = attr[-1]
        page = 1
        headers = {'referer': 'https://animepahe.com/'}

        apiUri = self.api_url + '?m=release&id=' + id_ + '&sort=episode_asc&page='
        jsonResponse = helpers.get(apiUri + str(page), headers=headers).json()
        lastPage = jsonResponse['last_page']
        perPage = jsonResponse['per_page']
        total = jsonResponse['total']
        ep = 1
        episodes = []

        if (lastPage == 1 and perPage > total):
            for epi in jsonResponse['data']:
                episodes.append(
                    f'{self.api_url}?m=links&id={epi["anime_id"]}&session={epi["session"]}&p=kwik!!TRUE!!')
        else:
            stop = False
            for page in range(lastPage):
                if stop:
                    break
                for i in range(perPage):
                    if ep <= total:
                        episodes.append(
                            f'{self.api_url}?m=release&id={id_}&sort=episode_asc&page={page+1}&ep={ep}!!FALSE!!')
                        ep += 1
                    else:
                        stop = True
                        break
        return episodes

    def _scrape_metadata(self):
        self.title = re.findall(r"TITLE!(.*?)!TITLE", self.url)[0]


class AnimePaheEpisode(AnimeEpisode, sitename='animepahe'):
    def _get_sources(self):
        if '!!TRUE!!' in self.url:
            self.url = self.url.replace('!!TRUE!!', '')
        else:
            headers = {'referer': 'https://animepahe.com/'}
            regex = r"\&ep\=(\d+)\!\!FALSE\!\!"
            episodeNum = int(re.findall(regex, self.url)[0])
            self.url = re.sub(regex, '', self.url)
            jsonResponse = helpers.get(self.url, headers=headers).json()

            ep = None
            for episode in jsonResponse['data']:
                if int(episode['episode']) == episodeNum:
                    ep = episode
            if ep:
                self.url = 'https://animepahe.com/api?m=links&id=' + str(ep['anime_id']) + '&session=' + ep['session'] + '&p=kwik'  # noqa
            else:
                raise NotFoundError

        episode_data = helpers.get(self.url).json()

        data = episode_data['data']
        qualities = [x + 'p' for f in data for x in f]

        sources_list = [
           f[x]['kwik_adfly'] for f in data for x in f
        ]

        for i, quality in enumerate(qualities):
            if self.quality == quality:
                return [("kwik", sources_list[i])]

        return [("kwik", x) for x in sources_list]
added animepahe created mp4upload extractor but not implemented 2018-08-19 13:03:07 -07:00			`import logging`
Added Kwik source to animepahe (#127) * Added Kwik source to animepahe * Updated Comment * Added referer to aria2c 2019-02-11 05:03:32 -08:00			`import re`
added animepahe created mp4upload extractor but not implemented 2018-08-19 13:03:07 -07:00
rewrite: site handling rewrite 2019-02-23 06:57:37 -08:00			`from anime_downloader.sites.anime import AnimeEpisode, SearchResult, Anime`
added animepahe created mp4upload extractor but not implemented 2018-08-19 13:03:07 -07:00			`from anime_downloader.sites.exceptions import NotFoundError`
chore: logging replaced with logger, style 2019-03-22 06:47:00 -07:00			`from anime_downloader.sites import helpers`
added animepahe created mp4upload extractor but not implemented 2018-08-19 13:03:07 -07:00
chore: logging replaced with logger, style 2019-03-22 06:47:00 -07:00			`logger = logging.getLogger(__name__)`
added animepahe created mp4upload extractor but not implemented 2018-08-19 13:03:07 -07:00

fix: check properly 2019-06-13 14:13:41 -07:00			`class AnimePahe(Anime, sitename='animepahe'):`
added animepahe created mp4upload extractor but not implemented 2018-08-19 13:03:07 -07:00			`sitename = 'animepahe'`
			`api_url = 'https://animepahe.com/api'`

			`@classmethod`
			`def search(cls, query):`
			`params = {`
			`'l': 8,`
			`'m': 'search',`
			`'q': query`
			`}`

Fixes AnimePahe and Kwik (#316) * Rely on AnimePahe for episode naming * Remove use of enumerate * Add useful debug info for mp4upload * Fix minor regex mishap for mp4upload * Better title naming for mp4upload * Minor tweaks complete * MP4Upload regex minor improvement * Make collection of sources look better * Revert back to using enumerate for episode numbering * Added utility function to parse episode range * Replace episode range collecting with utility function to parse episode range * Add grammar option to cli.py * Make grammar more consistent * Implement grammar parser and add as util function * Added search to gogoanime * Enable getting episode sources for Gogoanime * Minor refactor for grammar parser * Use new episode parser by default and add gogoanime to provider choices * Fix minor oversight to identify None type passed to episode parser * Remove explicit checks for None type in episode string parsers * Enable retries for request session * Make cfscrape capable of retrying * Make provider list more readable in cli.py * Handle failure to find stream URL better in MP4Upload extractor * Revert changes to match master * Update gogoanime domain * Fix failure to skip already downloaded files * Fix potential bug * Enable ranged download to resume stopped download * Avoid constantly opening and closing file in downloader * Make init the same as main forks * Changed files to match main * Add new line * Modify init * Added animefreak * Add useful comment for animefreak * Added animefreak to README.md * Use json method in helpers.get * Update title test for animefreak * Prioritise mp4upload as source and fix mp4upload source url * Better title handling and more explicit errors * More informative mp4upload exception * Adds changes for new animepahe API usage and fixes title handling * Fixes kwik * Minor fix for kwik 2020-04-14 11:34:47 -07:00			`search_results = helpers.get(cls.api_url, params=params).json()`
optimized animepahe I completely changed the way the episodes are scraped. But as a downside only the kwik server is used. 2021-05-16 10:14:34 -07:00			`if search_results['total'] == []:`
			`return []`

			`return [`
			`SearchResult(`
			`title=result['title'] + " (" + result['type'] + ")",`
added sort sources and fixed metadata 2021-05-16 10:28:49 -07:00			`url="https://animepahe.com/anime/TITLE!" + result['title'] + " (" + result['type'] + ")" + '!TITLE/' + result['session'] + "/" + str(result['id']), # noqa`
optimized animepahe I completely changed the way the episodes are scraped. But as a downside only the kwik server is used. 2021-05-16 10:14:34 -07:00			`poster=result['poster']`
added animepahe created mp4upload extractor but not implemented 2018-08-19 13:03:07 -07:00			`)`
optimized animepahe I completely changed the way the episodes are scraped. But as a downside only the kwik server is used. 2021-05-16 10:14:34 -07:00			`for result in search_results['data']`
			`]`

			`def _scrape_episodes(self):`
			`attr = self.url.split('/')`
			`session = attr[-2]`
			`id_ = attr[-1]`
			`page = 1`
			`headers = {'referer': 'https://animepahe.com/'}`

			`apiUri = self.api_url + '?m=release&id=' + id_ + '&sort=episode_asc&page='`
			`jsonResponse = helpers.get(apiUri + str(page), headers=headers).json()`
			`lastPage = jsonResponse['last_page']`
			`perPage = jsonResponse['per_page']`
			`total = jsonResponse['total']`
			`ep = 1`
			`episodes = []`

			`if (lastPage == 1 and perPage > total):`
			`for epi in jsonResponse['data']:`
			`episodes.append(`
			`f'{self.api_url}?m=links&id={epi["anime_id"]}&session={epi["session"]}&p=kwik!!TRUE!!')`
			`else:`
			`stop = False`
			`for page in range(lastPage):`
			`if stop:`
			`break`
			`for i in range(perPage):`
			`if ep <= total:`
			`episodes.append(`
			`f'{self.api_url}?m=release&id={id_}&sort=episode_asc&page={page+1}&ep={ep}!!FALSE!!')`
			`ep += 1`
			`else:`
			`stop = True`
			`break`
added animepahe created mp4upload extractor but not implemented 2018-08-19 13:03:07 -07:00			`return episodes`

added sort sources and fixed metadata 2021-05-16 10:28:49 -07:00			`def _scrape_metadata(self):`
			`self.title = re.findall(r"TITLE!(.*?)!TITLE", self.url)[0]`
optimized animepahe I completely changed the way the episodes are scraped. But as a downside only the kwik server is used. 2021-05-16 10:14:34 -07:00
added animepahe created mp4upload extractor but not implemented 2018-08-19 13:03:07 -07:00
optimized animepahe I completely changed the way the episodes are scraped. But as a downside only the kwik server is used. 2021-05-16 10:14:34 -07:00			`class AnimePaheEpisode(AnimeEpisode, sitename='animepahe'):`
			`def _get_sources(self):`
			`if '!!TRUE!!' in self.url:`
			`self.url = self.url.replace('!!TRUE!!', '')`
added animepahe created mp4upload extractor but not implemented 2018-08-19 13:03:07 -07:00			`else:`
optimized animepahe I completely changed the way the episodes are scraped. But as a downside only the kwik server is used. 2021-05-16 10:14:34 -07:00			`headers = {'referer': 'https://animepahe.com/'}`
			`regex = r"\&ep\=(\d+)\!\!FALSE\!\!"`
			`episodeNum = int(re.findall(regex, self.url)[0])`
			`self.url = re.sub(regex, '', self.url)`
			`jsonResponse = helpers.get(self.url, headers=headers).json()`

			`ep = None`
			`for episode in jsonResponse['data']:`
			`if int(episode['episode']) == episodeNum:`
			`ep = episode`
			`if ep:`
			`self.url = 'https://animepahe.com/api?m=links&id=' + str(ep['anime_id']) + '&session=' + ep['session'] + '&p=kwik' # noqa`
			`else:`
			`raise NotFoundError`

Update animepahe.py 2021-08-20 08:58:34 -07:00			`episode_data = helpers.get(self.url).json()`
added animepahe created mp4upload extractor but not implemented 2018-08-19 13:03:07 -07:00
Update animepahe.py 2021-08-20 08:58:34 -07:00			`data = episode_data['data']`
			`qualities = [x + 'p' for f in data for x in f]`
added animepahe created mp4upload extractor but not implemented 2018-08-19 13:03:07 -07:00
Update animepahe.py 2021-08-20 08:58:34 -07:00			`sources_list = [`
			`f[x]['kwik_adfly'] for f in data for x in f`
			`]`

			`for i, quality in enumerate(qualities):`
			`if self.quality == quality:`
			`return [("kwik", sources_list[i])]`
added sort sources and fixed metadata 2021-05-16 10:28:49 -07:00
Update animepahe.py 2021-08-20 08:58:34 -07:00			`return [("kwik", x) for x in sources_list]`