ShowAPI,自营为主的数据交易市场
立即注册

新闻、网页正文抽取

提供者: 易源官方 部分收费

传入一个新网或网页地址,接口将返回此url地址的正文及图片列表。通常用于获取新网网页的正文。

浏览量:6362

调用量:49584961

使用人数:9388

点赞:24

申请使用 查看演示
文档 授权签名(重要) 联系信息 价格一览表 接口演示
接入点列表
新闻、网页正文抽取
资源列表
·SDK及代码示例
规则中心
·名词解释
·常见问题

请求URL地址

http://route.showapi.com/883-1
注意:接口支持https,更安全,但稍慢一些,你懂的。请根据自己的情况进行选择。

请求参数

HTTP协议,支持GET/POST方法。
非文件上传的POST时,enctype=application/x-www-form-urlencoded。
文件上传的POST时,enctype=multipart/form-data。
1.系统级参数(所有接入点都需要的参数):+点此展开
2.应用级参数(每个接入点有自己的参数):
参数名称 类型 默认值 示例值 必须 描述
url String http://news.yesky.com/112/99481112.shtml 要抽取的正文地址
needHtml String 0 是否要返回html字段
needContent String 0 是否要返回content字段
needAll_list String 1 是否要返回all_list字段

返回参数

以JSON格式返回结果。
1.系统级参数(所有接入点都会返回的参数):+点此展开
2.应用级参数(系统级输出参数showapi_res_body字段中的json数据结构):
名称 类型 示例值 描述
content String 正文
html String 正文的html格式
img_list String 正文中包括的图片列表
time String 新闻发布时间
title String 网页标题。
all_list String 这是一个数组对象,包括了所有的文章段落以及图片。
ret_code String 0 0为成功,其他失败
  • 请求实例
  • java_sdk
  • 纯java
  • curl
  • php
  • android
  • python
String res=new ShowApiRequest("http://route.showapi.com/883-1","my_appId","my_appSecret")
           .addTextPara("url","")
           .post();
System.out.println(res);

                  public static void main(String path[]) throws Exception {
									URL u=new URL("http://route.showapi.com/883-1?showapi_appid=myappid&url=&needHtml=&needContent=&needAll_list=&showapi_sign=mysecret");
									InputStream in=u.openStream();
									ByteArrayOutputStream out=new ByteArrayOutputStream();
									try {
										byte buf[]=new byte[1024];
										int read = 0;
										while ((read = in.read(buf)) > 0) {
											out.write(buf, 0, read);
										}
									}  finally {
										if (in != null) {
											in.close();
										}
									}
									byte b[]=out.toByteArray( );
									System.out.println(new String(b,"utf-8"));
							}
						 
						
						//字段值为中文、空格、特殊符号的地方需要做urlencode,编码为utf-8。用js的方式就是:
						//encodeURIComponent('中文')
						//比如"中文"转换后就是%25E4%25B8%25AD%25E6%2596%2587
            curl   "http://route.showapi.com/883-1?showapi_appid=123&showapi_sign=use_my_sign&url=&"
						
						 //md5签名方式--非简单签名
               			<?php
							header("Content-Type:text/html;charset=UTF-8");
							date_default_timezone_set("PRC");
							$showapi_appid = 'xxxxxx';  //替换此值,在官网的"我的应用"中找到相关值
							$showapi_secret = 'xxxxxxxxx';  //替换此值,在官网的"我的应用"中找到相关值 
							$paramArr = array(
							     'showapi_appid'=> $showapi_appid,
								 'url'=> "",
								 'needHtml'=> "",
								 'needContent'=> "",
								 'needAll_list'=> ""
							     //添加其他参数
							);
							
							//创建参数(包括签名的处理)
							function createParam ($paramArr,$showapi_secret) {
							     $paraStr = "";
							     $signStr = "";
							     ksort($paramArr);
							     foreach ($paramArr as $key => $val) {
							         if ($key != '' && $val != '') {
							             $signStr .= $key.$val;
							             $paraStr .= $key.'='.urlencode($val).'&';
							         }
							     }
							     $signStr .= $showapi_secret;//排好序的参数加上secret,进行md5
							     $sign = strtolower(md5($signStr));
							     $paraStr .= 'showapi_sign='.$sign;//将md5后的值作为参数,便于服务器的效验
							     echo "排好序的参数:".$signStr."
\r\n"; return $paraStr; } $param = createParam($paramArr,$showapi_secret); $url = 'http://route.showapi.com/883-1?'.$param; echo "请求的url:".$url."
\r\n"; $result = file_get_contents($url); echo "返回的json数据:
\r\n"; print $result.'
\r\n'; $result = json_decode($result); echo "
\r\n取出showapi_res_code的值:
\r\n"; print_r($result->showapi_res_code); echo "
\r\n"; ?>
						//以下代码为纯java实现,并未依赖第三方框架,具体传入参数请参看接口描述详情页.
						protected Handler mHandler =  new Handler();
						protected void onCreate(Bundle savedInstanceState) {
								super.onCreate(savedInstanceState);
								setContentView(R.layout.activity_main);
								final TextView txt = (TextView) this.findViewById(R.id.textView1);
								Button myBtn = (Button) this.findViewById(R.id.button1);
								myBtn.setOnClickListener(new OnClickListener() {
									public void onClick(View v) {
										new Thread(){
											//在新线程中发送网络请求
											public void run() {
												String appid="xxx";//要替换成自己的
												String secret="xxxxxxx";//要替换成自己的
												final String res=new ShowApiRequest( "http://route.showapi.com/883-1", appid, secret)
                    .addTextPara("url", "")
                                .addTextPara("needHtml", "")
                                .addTextPara("needContent", "")
                                .addTextPara("needAll_list", "")
            .post();
												
												System.out.println(res);
												//把返回内容通过handler对象更新到界面
												mHandler.post(new Thread(){
													public void run() {
														txt.setText(res+"  "+new Date());
													}
												});
											}
										}.start();
										
										
									}
								});
						}

						
#python3.5
from urllib import    request, parse
import json

print('send data....')
showapi_appid="xxxxxxxxxx"  #替换此值
showapi_sign="xxxxxxxxxx"   #替换此值
url="http://route.showapi.com/883-1"
send_data = parse.urlencode([
    ('showapi_appid', showapi_appid)
    ,('showapi_sign', showapi_sign)
                    ,('url', "")
                    ,('needHtml', "")
                    ,('needContent', "")
                    ,('needAll_list', "")
    
  ])

req = request.Request(url)
try:
       response = request.urlopen(req, data=send_data.encode('utf-8'), timeout = 10) # 10秒超时反馈
except Exception as e:
    print(e)
result = response.read().decode('utf-8')
result_json = json.loads(result)
print ('result_json data is:', result_json)

						

返回实例

{
	"showapi_res_code": 0,
	"showapi_res_error": "",
	"showapi_res_body": {
		"all_list": [
			"微软在今年1月举行的“Windows 10下一篇章”发布会上,正式发布了巨型商务",
			"【天极网IT新闻频道】",
			"【Yesky新闻频道消息】",
			"  原计划,这款产品将于今年9月份出货。不过,日前微软再次推迟了发货日期到2016年1月1日,而且全系涨价2000美元,也就是55英寸Surface",
			"售价为8999美元,而84英寸型号售价将达21999美元(约合人民币14万)。",
			{
				"height": 256,
				"url": "http://image.tianjimedia.com/uploadImages/2015/357/13/7XFZ8BXOO15P_600.jpg",
				"width": 500
			},
			"  对此微软发言人表示,我们评估了市场机会并考虑到Surface Hub能够为用户提供独特的协作场景,新的价格是正确的,对我们的业务和产品类别向前发展都有好处。",
			"  此前,微软合作伙伴公司的高管Angela Hlavka透露,自从7月1日接受预定以来,这款天价产品市场需求高涨。",
			",支持100点触控。",
			"  其中,55寸的型号采用Intel四代i5处理器+核心",
			"  此外,微软还为Surface Hub配备了两个",
			"Pen和一个微软一体化媒体",
			"。55英寸和84英寸版本均带有两个前置1080p",
			"  微软称,Surface Hub除了液晶屏,其他元件的设计全部参与,他们还在Wilsonville建设了面积7万平方英尺(约合6500平方米)的工厂自己生产。",
			{
				"height": 196,
				"url": "http://www.yesky.com//uploadImages/2015/264/46/2OBRY213I2D8.jpg",
				"width": 600
			},
			"IT新闻微信公众平台",
			"* 网友发言均非本站立场,本站不在评论栏推荐任何网店、经销商,谨防上当受骗!"
		],
		"content": "微软在今年1月举行的“Windows 10下一篇章”发布会上,正式发布了巨型商务【天极网IT新闻频道】【Yesky新闻频道消息】  原计划,这款产品将于今年9月份出货。不过,日前微软再次推迟了发货日期到2016年1月1日,而且全系涨价2000美元,也就是55英寸Surface售价为8999美元,而84英寸型号售价将达21999美元(约合人民币14万)。  对此微软发言人表示,我们评估了市场机会并考虑到Surface Hub能够为用户提供独特的协作场景,新的价格是正确的,对我们的业务和产品类别向前发展都有好处。  此前,微软合作伙伴公司的高管Angela Hlavka透露,自从7月1日接受预定以来,这款天价产品市场需求高涨。,支持100点触控。  其中,55寸的型号采用Intel四代i5处理器+核心  此外,微软还为Surface Hub配备了两个Pen和一个微软一体化媒体。55英寸和84英寸版本均带有两个前置1080p  微软称,Surface Hub除了液晶屏,其他元件的设计全部参与,他们还在Wilsonville建设了面积7万平方英尺(约合6500平方米)的工厂自己生产。IT新闻微信公众平台第一时间获取新鲜资讯使用手机扫描左方二维码只为做最好 专访RAZER联合创始人兼CEO Min联通、金立高层谈合作:1+1>2的互动效应新创潮?绘声未来 访深圳洛可可总经理邓玉龙荣耀总裁赵明:让更多用户能快速体验VR技术引领无屏电视技术突破 专访极米科技CEO钟波大物流需要专业 专访日日顺物流总经理数据中国一周年 中科曙光历军有话说社交网络新趋势:无视频不社交?谷歌Android系统有望彻底称霸全球么?五大标准 飞贷重新定义手机APP贷款酷开王志国:大屏时代的智慧生活企业会员与社区发展并重 ODL发力SDN市场苹果真的衰落了么 还是说是在憋大招?苹果手机将开始走下坡路? 担心太早了从EasyOP看中科曙光HPC的共享经济玩法移动手游市场大爆发 \"大IP时代\"将至?中国制造发力 打破洁身器行业多年沉寂琵琶遮面 Surface Hub被推迟到明年3月上市微软发布巨型平板Surface Hub入门视频微软超级平板Surface Hub将推迟上市微软Surface Hub将推迟上市 售价近2万美元每日IT极热 三星将推可折叠机IT极热 ",
		"html": "<p>微软在今年1月举行的“Windows 10下一篇章”发布会上,正式发布了巨型商务</p><p>【天极网IT新闻频道】</p><p>【Yesky新闻频道消息】</p><p>  原计划,这款产品将于今年9月份出货。不过,日前微软再次推迟了发货日期到2016年1月1日,而且全系涨价2000美元,也就是55英寸Surface</p><p>售价为8999美元,而84英寸型号售价将达21999美元(约合人民币14万)。</p><p>  对此微软发言人表示,我们评估了市场机会并考虑到Surface Hub能够为用户提供独特的协作场景,新的价格是正确的,对我们的业务和产品类别向前发展都有好处。</p><p>  此前,微软合作伙伴公司的高管Angela Hlavka透露,自从7月1日接受预定以来,这款天价产品市场需求高涨。</p><p>,支持100点触控。</p><p>  其中,55寸的型号采用Intel四代i5处理器+核心</p><p>  此外,微软还为Surface Hub配备了两个</p><p>Pen和一个微软一体化媒体</p><p>。55英寸和84英寸版本均带有两个前置1080p</p><p>  微软称,Surface Hub除了液晶屏,其他元件的设计全部参与,他们还在Wilsonville建设了面积7万平方英尺(约合6500平方米)的工厂自己生产。</p><p>IT新闻微信公众平台</p><p>第一时间获取新鲜资讯</p><p>使用手机扫描左方二维码</p><p>只为做最好 专访RAZER联合创始人兼CEO Min</p><p>联通、金立高层谈合作:1+1>2的互动效应</p><p>新创潮?绘声未来 访深圳洛可可总经理邓玉龙</p><p>荣耀总裁赵明:让更多用户能快速体验VR技术</p><p>引领无屏电视技术突破 专访极米科技CEO钟波</p><p>大物流需要专业 专访日日顺物流总经理</p><p>数据中国一周年 中科曙光历军有话说</p><p>社交网络新趋势:无视频不社交?</p><p>谷歌Android系统有望彻底称霸全球么?</p><p>五大标准 飞贷重新定义手机APP贷款</p><p>酷开王志国:大屏时代的智慧生活</p><p>企业会员与社区发展并重 ODL发力SDN市场</p><p>苹果真的衰落了么 还是说是在憋大招?</p><p>苹果手机将开始走下坡路? 担心太早了</p><p>从EasyOP看中科曙光HPC的共享经济玩法</p><p>移动手游市场大爆发 \"大IP时代\"将至?</p>",
		"img_list": [
			{
				"height": 256,
				"url": "http://image.tianjimedia.com/uploadImages/2015/357/13/7XFZ8BXOO15P_600.jpg",
				"width": 500
			},
			{
				"height": 196,
				"url": "http://www.yesky.com//uploadImages/2015/264/46/2OBRY213I2D8.jpg",
				"width": 600
			}
		],
		"ret_code": 0,
		"time": "2016-1-1",
		"title": "SurfaceHub延至2016年1月1日发货且全系涨价"
	}
}




请求地址 请求参数 返回参数 请求示例 返回示例
接入点列表
新闻、网页正文抽取
  • 免费套餐(新闻、网页正文抽取)

免费套餐_无认证版

0时间:1年

  • 不限调用次数
  • 1次/秒调用频率
  •  
  •  
点此订购

免费套餐_基本认证版

0时间:1年

  • 不限调用次数
  • 2次/秒调用频率
  • 邮箱认证 要求
  • 手机认证 要求
点此订购

免费套餐_实名认证版

0时间:1年

  • 不限调用次数
  • 3次/秒调用频率
  • 邮箱认证 要求
  • 手机认证 要求
  • 实名认证 要求
点此订购
  • 即充即用流量包(新闻、网页正文抽取)

699元10万次

699 时间:1年

  • 100000次调用
  • 不限调用频率
订购套餐