khangtran
/
dark_web_forums

__author__ = 'DarkWeb'
'''

'''

import osfrom datetime import *from Forums.BestCardingWorld.crawler_selenium import crawler as crawlerBestCardingWorldfrom Forums.CryptBB.crawler_selenium import crawler as crawlerCryptBBfrom Forums.OnniForums.crawler_selenium import crawler as crawlerOnniForumsfrom Forums.AbyssForum.crawler_selenium import crawler as crawlerAbyssForumfrom Forums.Procrax.crawler_selenium import crawler as crawlerProcraxForumfrom Forums.HiddenAnswers.crawler_selenium import crawler as crawlerHiddenAnswersfrom Forums.Cardingleaks.crawler_selenium import crawler as crawlerCardingleaksfrom Forums.Altenens.crawler_selenium import crawler as crawlerAltenens
import configparserimport time
config = configparser.ConfigParser()config.read('../../setup.ini')CURRENT_DATE = str("%02d" % date.today().month) + str("%02d" % date.today().day) + str("%04d" % date.today().year)

# reads list of marketplaces manually inputteddef getForums():    forums = []    with open('forumsList.txt') as f:        forums = f.readlines()    return forums

# Creates needed directories for marketplace if doesn't existdef createDirectory(forum):
    # Package should already be there, holding crawler and parser    if forum == 'Reddits':        pagesMainDir = '../' + forum    else:        # pagesMainDir = '../' + forum + "/HTML_Pages"        pagesMainDir = os.path.join(config.get('Project', 'shared_folder'), "Forums/" + forum + "/HTML_Pages")
    if not os.path.isdir(pagesMainDir):        os.makedirs(pagesMainDir)
    if forum == 'Reddits':        createRedditsSubdirectories(pagesMainDir)    else:        createSubdirectories(pagesMainDir)

def createRedditsSubdirectories(pagesMainDir):
    with open('../Reddits/redditsList.txt', 'r') as f:        reddits = f.readlines()
    for reddit in reddits:        reddit = reddit.strip('\n')        redditMainDir = pagesMainDir + '/' + reddit + '/HTML_Pages'        if not os.path.isdir(redditMainDir):            os.mkdir(redditMainDir)        # Create inner time folders        createSubdirectories(redditMainDir)

def createSubdirectories(pagesDir):
    currentDateDir = pagesDir + '/' + CURRENT_DATE    if not os.path.isdir(currentDateDir):        os.mkdir(currentDateDir)
    listingDir = currentDateDir + '/Listing'    if not os.path.isdir(listingDir):        os.mkdir(listingDir)
    listReadDir = listingDir + '/Read'    if not os.path.isdir(listReadDir):        os.mkdir(listReadDir)
    descriptionDir = currentDateDir + '/Description'    if not os.path.isdir(descriptionDir):        os.mkdir(descriptionDir)
    descReadDir = descriptionDir + '/Read'    if not os.path.isdir(descReadDir):        os.mkdir(descReadDir)

# main methodif __name__ == '__main__':
    # assignment from forumsList.txt    forumsList = getForums()
    # get forum from forumsList    for forum in forumsList:        forum = forum.replace('\n','')
        print("Creating listing and description directories ... for " + forum)        createDirectory(forum)        time.sleep(5)  # wait for directories to be created        input("Directories created successfully. Press ENTER to continue\n")        
        if forum == "BestCardingWorld":            crawlerBestCardingWorld()        elif forum == "CryptBB":            crawlerCryptBB()        elif forum == "OnniForums":            crawlerOnniForums()        elif forum == "AbyssForum":            crawlerAbyssForum()        elif forum == "HiddenAnswers":            crawlerHiddenAnswers()        elif forum == "Altenens":            crawlerAltenens()        elif forum == 'Procrax':            crawlerProcraxForum()        elif forum == 'Cardingleaks':            crawlerCardingleaks()


    print("Scraping process completed successfully!")