取得指定网站的目录结构、catalog等内容。 分析网站的技术栈,基于wappalyzer.csv文件中的信息,优化策略。 技术栈和工具 Python:使用Python 3.x版本,利用其强大的库支持完成开发。 Scrapy或BeautifulSoup:用于抓取网页内容和解析HTML。 Pandas:处理和分析wappalyzer.csv中的数据,辅助优化策略。 Requests:发送HTTP请求。 Selenium或Puppeteer(如果需要处理JavaScript渲染的页面)。 功能要求 目录和内容取得: 取得网站的目录结构,包括所有页面的URLs。 根据目录结构,取得每个页面的具体内容,尤其是catalog部分。 技术栈分析与应用: 使用Pandas分析wappalyzer.csv,确定目标网站使用的关键技术栈。 根据技术栈特点调整策略,例如处理SPA(单页面应用)或解析JSON API。 数据存储: 取得的目录结构和页面内容应存储在适当的格式中,如CSV文件或数据库。 反反机制: 实现IP轮换、设置合理的请求间隔、使用随机User-Agent等策略,避免被封禁。 错误处理和日志记录: 实现错误处理机制,确保稳定运行。 记录日志,包括取得过程中的关键信息和可能的错误信息。 交付物 完整的源代码。 取得到的数据文件。 实施报告,包含取得策略、遇到的问题、解决方案及优化建议。 发布任务
进行中 2024-03-13发布
• 应用场景: 这个网站必须包括你的个人作品集5页的页面-你的主页,一个关于我的页面,一个项目页面,一个服务页面,和一个联系我页面。 1. 您的网站必须包含个人作品集的适当内容 a.你必须包含一个导航栏或其他导航方案,允许用户查看你网站的每个页面。 b.你必须为你的网站包含一个自定义徽标,它应该被放置在主导航栏内或周围。自定义Logo可以是简单的,也可以是你想要的艺术(例如,你可以使用一个原始的充满颜色的形状,比如三角形或六边形,里面有你的首字母)。请不要使用属于其他公司或个人的标志。 c.你的主页应该包括一些欢迎信息和链接或按钮,允许用户重定向到你的“关于我”页面和/或其他页面。我建议还包括一些使命宣言。 你的“关于我”页面应该包括你的法定姓名、一张你的照片(我建议是一张头和肩膀的照片)、一段关于你是谁的简短文字。保持简历简洁明了,这样可能会被未来的雇主看到。 e.你的“关于我”页面应该包含一个PDF版本的简历链接。 你的项目页面应该包含至少3个你希望突出显示的项目的图片和信息。这些可以是你目前正在进行的项目,也可以是你过去完成的项目。包括每个项目的图片和你的角色和结果的简短描述。 g.您的服务页面应包括您提供的服务的简短列表(例如,通用编程,web开发,移动应用程序等)。我建议添加一些图片,使其更有吸引力。 h.您的联系页面应在面板或其他结构中包含您的联系信息。 你的联系人页面应该包括一个简短的互动表单,允许用户给你发送消息,并提供基本的联系信息(名字,姓氏,联系电话,电子邮件地址,信息等)。这个表单一开始并不需要具有完整的功能。但是,它应该能够捕获用户输入的信息并将其重定向回主页。 你的JavaScript, CSS和多媒体资产文件是功能性的。 你所有的代码(HTML, CSS, JavaScript, jQuery等)都是没有错误的。 2. 包括网站的内部文件(5分:内部文件): a.确保你在CSS和JavaScript文件中包含一个注释头,指出 文件名、学生姓名、学生编号和日期。 b.确保你在所有的HTML结构、CSS样式的章节中都包含一个章节头, 和任何JavaScript函数。 确保你所有的代码使用上下文变量名,这有助于使文件易于阅读。 3. 在GitHub上分享您的文件,以演示版本控制最佳实践,并将您的网站推送到云主机(云托管)。 a.您的存储库必须包含您的代码并且结构良好。 你的存储库必须包含在不同开发阶段更新项目的提交——每次实现重大变更时。 c.你必须使用git将你的站点部署到云服务器上 提交的材料应包括: 1. 你的网站的项目文件的zip存档- 2. 链接到GitHub(优选)。- 3. 一个链接到您的实时投资组合网站托管到您的云服务器使用git。 需求信息 This site must include the pages from your Personal Portfolio 5 pages – your Home page, an About Me page, a Projects page, a Services page, and a Contact Me page.   1.      Your Site must include the appropriate content for a Personal Portfolio (65 Marks: Content) a.      You must include a Navigation Bar or other Navigation scheme that allows the user to view each page of your site. b.      You must include a Custom Logo for your site, this should be placed in or around the main Navigation bar. The Custom Logo can be as simple or artistic as you desire (e.g. you could use a primitive colour-filled shape like a triangle or hexagon with your initials positioned inside). Please do not use a logo that belongs to another company or person. c.      Your Home Page should include some sort of welcome message and link or button that allows the user to redirect to your About Me Page and / or other pages. I recommend also including some sort of Mission Statement. d.      Your About Me Page should include your legal name, an image of you (I recommend a head and shoulders shot), a short paragraph about who you are. Keep this clean and simple as it may be viewed by perspective employers. e.      Your About Me page should include a link to a PDF version of your Resume. f.       Your Projects Page should include images and information for at least 3 Projects you wish to highlight. These could be current projects you are working on or past projects you have completed. Include an image for each Project and a short description of your role and the outcome. g.      Your Services Page should include a short list of services you offer (e.g. general programming, web development, mobile apps, etc.). I recommend including images that make this more appealing to view. h.      Your Contact Page should include your contact information in a panel or other construct. i.        Your Contact Page should include a short interactive form that allows the user send you a message and provide basic contact information (First Name, Last Name, Contact Number, Email Address, Message, etc.). This form does not have to be fully functional initially. However, it should be able to capture the information entered by the user and redirect them back to the Home Page. j.        Your JavaScript, CSS and Multimedia Asset Files are functional. k.      All Your Code (HTML, CSS, JavaScript, jQuery, etc.) is error free. 2.      Include Internal Documentation for your site (5 Marks: Internal Documentation): a.      Ensure you include a comment header for your CSS and JavaScript files that indicate: the File name, Student’s Name, StudentID, and Date. b.      Ensure you include a section headers for all of your HTML structure, CSS style sections, and any JavaScript functions. c.      Ensure all your code uses contextual variable names that help make the files human- readable.   3.      Share your files on GitHub to demonstrate Version Control Best Practices and push your site to a cloud host (10 Marks: Cloud Hosting). a.      Your repository must include your code and be well structured. b.      Your repository must include commits that demonstrate the project being updated at different stages of development – each time a major change is implemented. c.      You must deploy your site to your Cloud Server using git     SUBMITTING YOUR WORK Your submission should include: 1.      A zip archive of your website’s Project files – 5 marks 2.      A link to GitHub (preferable). – 5 marks 3.      A link to your live portfolio site hosted to your Cloud Server using git. – 10 marks -------------------------------------------------------------------
进行中 2024-01-29发布
