gallery-dl/gallery_dl/extractor/recursive.py

# -*- coding: utf-8 -*-

# Copyright 2015, 2016 Mike Fährmann
#
# This program is free software; you can redistribute it and/or modify
# it under the terms of the GNU General Public License version 2 as
# published by the Free Software Foundation.

"""Recursive extractor"""

import re
from .common import Extractor, Message
from .. import adapter


class RecursiveExtractor(Extractor):

    category = "recursive"
    pattern = ["r(?:ecursive)?:(.+)"]
    test = [("recursive:https://pastebin.com/raw/FLwrCYsT", {
        "url": "eee86d65c346361b818e8f4b2b307d9429f136a2",
    })]

    def __init__(self, match):
        Extractor.__init__(self)
        self.session.mount("file://", adapter.FileAdapter())
        self.url = match.group(1)

    def items(self):
        page = self.request(self.url).text
        yield Message.Version, 1
        for match in re.finditer(r"https?://[^\s\"']+", page):
            yield Message.Queue, match.group(0)
add provisional generic extractor 2015-12-03 00:50:34 +01:00			`# -- coding: utf-8 --`

rename 'generic' to 'recursive' 2016-10-01 15:54:27 +02:00			`# Copyright 2015, 2016 Mike Fährmann`
add provisional generic extractor 2015-12-03 00:50:34 +01:00			`#`
			`# This program is free software; you can redistribute it and/or modify`
			`# it under the terms of the GNU General Public License version 2 as`
			`# published by the Free Software Foundation.`

rename 'generic' to 'recursive' 2016-10-01 15:54:27 +02:00			`"""Recursive extractor"""`
add provisional generic extractor 2015-12-03 00:50:34 +01:00
			`import re`
			`from .common import Extractor, Message`
add basic support for file:// URLs this allows you to feed local files into the recursive extractor 2016-12-05 18:27:36 +01:00			`from .. import adapter`
add provisional generic extractor 2015-12-03 00:50:34 +01:00
code adjustments according to pep8 nr2 2017-02-01 00:53:19 +01:00
rename 'generic' to 'recursive' 2016-10-01 15:54:27 +02:00			`class RecursiveExtractor(Extractor):`
add provisional generic extractor 2015-12-03 00:50:34 +01:00
rename 'generic' to 'recursive' 2016-10-01 15:54:27 +02:00			`category = "recursive"`
			`pattern = ["r(?:ecursive)?:(.+)"]`
			`test = [("recursive:https://pastebin.com/raw/FLwrCYsT", {`
			`"url": "eee86d65c346361b818e8f4b2b307d9429f136a2",`
			`})]`
add provisional generic extractor 2015-12-03 00:50:34 +01:00
			`def __init__(self, match):`
			`Extractor.__init__(self)`
add basic support for file:// URLs this allows you to feed local files into the recursive extractor 2016-12-05 18:27:36 +01:00			`self.session.mount("file://", adapter.FileAdapter())`
add provisional generic extractor 2015-12-03 00:50:34 +01:00			`self.url = match.group(1)`

			`def items(self):`
			`page = self.request(self.url).text`
			`yield Message.Version, 1`
rename 'generic' to 'recursive' 2016-10-01 15:54:27 +02:00			`for match in re.finditer(r"https?://[^\s\"']+", page):`
add provisional generic extractor 2015-12-03 00:50:34 +01:00			`yield Message.Queue, match.group(0)`