jishigou / thinksns
每天自动化批量获取weibo食堂----美食菜谱图片
下载固定微博页面文件index.php?mod=yugao008准备调试脚本,并展示文件名[root@localhost ~]# wget http://weibo.cns*****.com/index.php?mod=yugao008 | ls -l index.php\?mod\=yugao008
-rw-r--r-- 1 root root 135540 04-23 11:37 index.php?mod=yugao008
搜索图片文件含o.jpg关键词的行,并展示
[root@localhost ~]# grep 'o.jpg" class="artZoomAll"' index.php\?mod\=yugao008 | more
<li><a href="http://weibo.cns*****.com/images/topic/9/39/75512_o.jpg" class="artZoomAll" rel="http://weibo.cns*****.com/images/topic/9/39/75512_s.jpg" rev="1444907_lLhRjs"><img src="http://wei *.com/images/topic/9/39/75512_s.jpg" /></a></li> <li><a href="http://weibo.cns*****.com/images/topic/3/27/75505_o.jpg" class="artZoomAll" rel="http://weibo.cns*****.com/images/topic/3/27/75505_s.jpg" rev="1444805_LiCXAH"><img src="http://wei *.com/images/topic/3/27/75505_s.jpg" /></a></li> <li><a href="http://weibo.cns*****.com/images/topic/e/19/75506_o.jpg" class="artZoomAll" rel="http://weibo.cns*****.com/images/topic/e/19/75506_s.jpg" rev="1444805_LiCXAH"><img src="http://wei *.com/images/topic/e/19/75506_s.jpg" /></a></li>搜索图片文件含o.jpg关键词的行,以awk截取引号分割第二段url另存为$(hostname)_$(date +%Y%m%d%H%M%S).txt文件,并展示各文件名
[root@locahost ~]# grep 'o.jpg" class="artZoomAll"' index.php\?mod\=yugao008 | awk -F "\"" '{print $2}' > $(hostname)_$(date +%Y%m%d%H%M%S).txt | ls -l $(hostname)*.txt
-rw-r--r-- 1 root root 1286 04-23 12:59 lindows_20130423125938.txt
-rw-r--r-- 1 root root 1286 04-23 14:49 lindows_20130423144952.txt
-rw-r--r-- 1 root root 1286 04-23 14:49 lindows_20130423144957.txt
-rw-r--r-- 1 root root 1286 04-23 14:51 lindows_20130423145111.txt
-rw-r--r-- 1 root root 1286 04-23 14:51 lindows_20130423145149.txt
-rw-r--r-- 1 root root 1286 04-23 14:53 lindows_20130423145307.txt
、、、
搜索图片文件含o.jpg关键词的行,以awk截取引号分割第二段url另存为$(hostname)_$(date +%Y%m%d%H%M%S).txt文件,并展示各文件名及其内容
[root@localhost ~]# ls -l $(hostname)*.txt
[root@localhost ~]# more lindows_20130423125938.txt
http://weibo.cns*****.com/images/topic/9/39/75512_o.jpg
http://weibo.cns*****.com/images/topic/3/27/75505_o.jpg
http://weibo.cns*****.com/images/topic/e/19/75506_o.jpg
http://weibo.cns*****.com/images/topic/d/82/75500_o.jpg
http://weibo.cns*****.com/images/topic/9/45/75501_o.jpg
、、、
搜索所有$(hostname)*.txt文件里含http关键词的行并展示各文件名和内容
[root@localhost ~]# grep 'o.jpg" class="artZoomAll"' index.php\?mod\=yugao008 | awk -F "\"" '{print $2}' > $(hostname)_$(date +%Y%m%d%H%M%S).txt | grep http $(hostname)*.txt | more
lindows_20130423144952.txt:http://weibo.cns*****.com/images/topic/9/45/75501_o.jpg
lindows_20130423144952.txt:http://weibo.cns*****.com/images/topic/0/17/75458_o.jpg
lindows_20130423144952.txt:http://weibo.cns*****.com/images/topic/c/99/75459_o.jpg
lindows_20130423144952.txt:http://weibo.cns*****.com/images/topic/b/28/75454_o.jpg
、、、
搜索所有$(hostname)*.txt文件里含http关键词的行,删除lindows*.txt:的文字后,排序且删除重复项后并展示
[root@localhost ~]# grep 'o.jpg" class="artZoomAll"' index.php\?mod\=yugao008 | awk -F "\"" '{print $2}' > $(hostname)_$(date +%Y%m%d%H%M%S).txt | grep http $(hostname)*.txt | awk -F "txt:" '{print $2}' | sort | uniq | more
http://weibo.cns*****.com/images/topic/0/17/75458_o.jpg
http://weibo.cns*****.com/images/topic/0/20/75450_o.jpg
http://weibo.cns*****.com/images/topic/3/25/75423_o.jpg
http://weibo.cns*****.com/images/topic/3/27/75505_o.jpg
http://weibo.cns*****.com/images/topic/3/82/75455_o.jpg
http://weibo.cns*****.com/images/topic/4/27/75302_o.jpg
http://weibo.cns*****.com/images/topic/5/27/75276_o.jpg
http://weibo.cns*****.com/images/topic/6/0/75351_o.jpg
http://weibo.cns*****.com/images/topic/6/3/75390_o.jpg
、、、
搜索所有$(hostname)*.txt文件里含http关键词的行,删除lindows*.txt:的文字后,排序且删除重复项后并展示,并批量下载所有jpg到指定目录/home/lindows/
[root@locahost ~]# grep 'o.jpg" class="artZoomAll"' index.php\?mod\=yugao008 | awk -F "\"" '{print $2}' > $(hostname)_$(date +%Y%m%d%H%M%S).txt | grep http $(hostname)*.txt | awk -F "txt:" '{print $2}' | sort | uniq | more | xargs -I {} wget -P /home/lindows/ {}
相关推荐
微博权限管理系统的项目,可以放到自己的电脑上试试,是项目的源文件!
2.1.1 About the Project 项目介绍 2 2.2 Soft function 软件功能 2 3 Functional Requirements 功能需求 3 3.1User Case总体用例 3 1) UI Model Use Case Diagram UI模块用例图 3 1.1.1 Use Case微博广场模块 3 ...
Cong Jin , YDJSIR, Sugar Xu‘s project of 2020 Data Science Basic Course in SWI, NJU. 此为发布开源的版本而不是开发环境中使用的版本。 ## 文件结构 ```bash │ LICENSE │ README.md ├─Analyze # 分析...
基于微博的数据挖掘与社交舆情分析 This project consists of four parts: 1. Crawl weibo data, contain comment、userinfo etc... 2. Process the captured data to the format we want 3. Analyze the data in ...
先在 build.gradle(Project:XXXX) 的 repositories 添加: allprojects { repositories { ... maven { url 'https://jitpack.io' } } } >> 2.然后在 build.gradle(Module:app) 的 dependencies 添加: ...
7 集成友盟第三方分享(QQ空间分享,微信朋友圈,新浪微博分享,QQ微博分享,微信好友) 8 增加关于CocoaLumberjack日志记录的展示及查看页面 9 增加百度地图显示页面功能实例,实现在地图上显示几个坐标点,并...
P2P微博 分布式微博与。 每个帖子都是一个新的分隔的dat文件。 新帖子的dat url将添加到posts.json文件中。 每个用户都可以订阅其他用户,将dat url添加到sources.json文件中。 订阅基于其他用户的posts.json...
概述这是新浪微博官方 Android SDK Demo 使用 Android Studio 导入、编译并运行通过的版本。...说明在使用 Android Studio 导入新浪微博 SDK ...Project 说明官方项目中有两个 Project:WeiboSDKWeiboSDKDemoWeiboSDKDemo
作者AndroidHJS,源码AndroidProject,简单说几句 敲这个项目也是一时兴起,但是在敲这个项目过程,发现越敲越有劲。可以把自己在CSDN,掘金,干货集中营看到酷炫的效果运用到这个项目,有时候我也可以通过这个项目去...
本系统主要采用Java作为开发语言,目前流行的spring boot作为框架,数据库使用Mysql,开发环境为IntelliJ IDEA,并且使用流行的tomcat8...最新发布等等功能,和现有的其他微博软件一样,满足各种需求,使用也方便。
基于微博的数据挖掘与社交舆情分析This project consists of four parts:1. Crawl weibo data, contain comment、userinfo etc...2. Process the captured data to the format we want3. Analyze the data in order ...
SocialSDK 对第三方社会化原生SDK集成和二次封装,提供微博、微信、QQ的登陆... compile project(':socialsdk') } 在app级别的 build-gradle 中defaultConfig配置申请的QQ的APP_ID defaultConfig { manifestPlacehol
这个源码是类似新浪微博iPhone版引导界面,源码AndroidAnimationDemo,The project is only in the Samsung Note 3 Android 4.4 on the test is successful! 本项目仅在三星 Note 3 Android 4.4上测试成功! 更新 ...
XZImgBrowser一款ios仿微博的图片浏览器工具特点:实现渐变的放大效果、渐变的位置移动InstallingCocoaPodsXZImgBrowser can be installed using .If you haven't done so already, you might want to initialize ...
Graduation Design Project --- 基于AdaBoost算法的情感分析研究 一、 使用微博应用获取微博文本 二、 SVM初步分类 三、 利用贝叶斯定理进行情感分析 四、 利用AdaBoost加强分类器 仅供学习之用。
$ git clone https://github.com/zmrenwu/django-blog-project 创建项目所需的环境变量文件,在项目根目录创建名为.envs / .production文件夹,并在.production文件夹下创建.django和.postgres文件,写入如下内容 ....
程序员面试刷题的书哪个好 --设置app启动图时,出现警告:An iPhone Retina (4-inch) launch image for iOS 7.0 ...因为app是从9.0开始支持的,所以启动图必须包含4英寸的图以供SE使用。...5、你会发现PROJECT---Localiz
demo的推出,使得云信SDK的开发者们可以更便捷的利用移动端渠道推广他们的即时通讯产品(如微信、手机微博、手机浏览器等),或通过WebView嵌入到嵌入式设备中,作为混合APP进行发布。 h5 demo 体验地址: h5 demo ...
微博推荐item预测中期报告 作业提交时间:2016.6.21 学生信息 宁小东 2120151024 王新灵 2120150994 黄建峰 2120151042 数据集 随机抽样后的数据集文件(为了便于上传) 处理说明 对原始文档(共4.08GB含6个文件)...