Jsuop进行链接提取

2023-05-04 20:23:05 来源:清一色财经


【资料图】

博主发表的文章,有的是自己原创,有的是这些年本人从网上积累的,方便大家学习。

[[178886]]

//检索WebContent中的图片和附件Documentdoc=Jsoup.parse(info.getWebc().getWebContent());//当前页中的图片ElementssrcLinks=doc.select("img[src]");StringimagesPath="";for(Elementlink:srcLinks){//剔除标签,只剩链接路径StringimagesPaths=link.attr("src");Stringht=imagesPaths.substring(0,4);Stringhtt=imagesPaths.substring(0,1);if(!ht.equals("http")&&htt.equals("/")){imagesPath=imagesPaths.trim().replaceAll(ContextPath,"");imagesPath=imagesPath.substring(imagesPath.lastIndexOf("/")+1);}else{imagesPath="";}//System.out.println("---导入WebContent中的图片---"+imagesPath);if(!imagesPath.equals("")){importCopy("/html/"+strSiteID+"/"+strColumnID+"/"+keyID+"/"+imagesPath,path,strInfoID,"/html/"+strSiteID+"/"+strColumnID+"/"+keyID+"/");}}//提取所有的href连接StringfilePaths="";Elementslinehrefs=doc.select("a[href]");for(Elementlink:linehrefs){filePaths=link.attr("href").trim().replaceAll(ContextPath,"");filePaths=filePaths.substring(filePaths.lastIndexOf("/")+1);//System.out.println("---导入WebContent中的文件---"+filePaths);if(!filePaths.equals("")){importCopy("/html/"+strSiteID+"/"+strColumnID+"/"+keyID+"/"+filePaths,path,strInfoID,"/html/"+strSiteID+"/"+strColumnID+"/"+keyID+"/");}}

【本文是清一色专栏作者张勇波的原创文章,转载请通过清一色获取作者授权】

上一篇 : 中山旅游攻略_中山旅游行程全攻略

下一篇 : 最后一页

x

相关推荐