c# 抓取 js动态生成的HTML的工具:NHtmlUnit?
2021/7/23 9:07:35
本文主要是介绍c# 抓取 js动态生成的HTML的工具:NHtmlUnit?,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!
(此博客文章纯属个人记录,转载请注明出处!)
官方地址:NHtmlUnit
编译获取dll方法:
1.下载nuget.exe (nuget所在网站:http://www.nuget.org/)
2.打开DOS命令对话框,
进入nuget.exe文件所在目录(我的exe文件放在桌面)
3.运行命令安装NHtmlUnit,安装后会在当前目录创建两个文件夹,一个是安装所需环境IKVM,另一个就是需要的NHtmlUnit文件夹,里面的lib目录下面有生成的dll
运行命令:nuget install NHtmlUnit
3.使用方法可以去HtmlUnit的官方网站阅读文档,或在博客园搜索教程,与JAVA的HtmlUnit的用法是一样的,NHtmlUnit只是
在HtmlUnit上加了个壳使.net可以调用JAVA而已。
实例代码(引用dll:HtmlUnit,NHtmlUnit,为了偷懒,我把所有IKVM的dll都引用了):
class Program { static void Main(string[] args) { WebClient client = new WebClient(); client.Options.JavaScriptEnabled = false; client.Options.CssEnabled = true; client.Options.ThrowExceptionOnScriptError = false; client.Options.Timeout = 5000; HtmlPage page = client.GetHtmlPage("http://www.baidu.com/#wd=11&rsv_spt=1&issp=1&rsv_bp=0&ie=utf-8&tn=baiduhome_pg&rsv_sug3=2&rsv_sug2=0&inputT=26"); Thread.Sleep(3000); string xml = page.AsXml(); HtmlDocument doc = new HtmlDocument();//忽略此类,这个类是其他DLL提供的,与NHtmlUnit无关 doc.LoadHtml(xml); string nodeName = doc.GetElementbyId("container").Name; Console.WriteLine("\r\n\r\n\r\n\r\n" + nodeName + "\r\n\r\n\r\n\r\n" ); Console.Read(); } }
这篇关于c# 抓取 js动态生成的HTML的工具:NHtmlUnit?的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!
- 2022-03-01沐雪多租宝商城源码从.NetCore3.1升级到.Net6的步骤
- 2024-11-18微软研究:RAG系统的四个层次提升理解与回答能力
- 2024-11-15C#中怎么从PEM格式的证书中提取公钥?-icode9专业技术文章分享
- 2024-11-14云架构设计——如何用diagrams.net绘制专业的AWS架构图?
- 2024-05-08首个适配Visual Studio平台的国产智能编程助手CodeGeeX正式上线!C#程序员必备效率神器!
- 2024-03-30C#设计模式之十六迭代器模式(Iterator Pattern)【行为型】
- 2024-03-29c# datetime tryparse
- 2024-02-21list find index c#
- 2024-01-24convert toint32 c#
- 2024-01-24Advanced .Net Debugging 1:你必须知道的调试工具