我对 HTML 不太熟悉。我在基于 HTML 的服务器上有一个文件结构,如下所示:
文件夹A ->文件 1,2,3,4,5... 文件夹b 。 。 。 如何在 C# 或 Java 中使用 HTTP 请求获取可用文件和文件夹的列表?我可以请求一个 URL,例如: http://abc.com/files 现在该页面具有该目录中的文件和文件夹的标签。那么有没有办法获取该目录下的文件夹中所有子文件的列表???
希望这是有道理的。
更新:
谢谢大家,但这很难解释。好的,该网页是由名为 AirStash 的设备生成的,该设备通过创建自己的 WIFI 网络和网页来传输 SD 卡中包含的数据 http://airstash.net/files 。 html 的来源看起来像这样。
....
<body><div class="centerbox"><div class="logo"><img src="/airstash.png" alt="AirStash®" title="AirStash®"> <span class="SettingsButton"><a href="/settings.html">Settings</a></span></div>
<div id="sorts">
<a class="MedText" href="101DIR00">101DIR00</a>
<a class="MedText" href="102DIR00">102DIR00</a>
<a class="MedText" href="103DIR00">103DIR00</a>
<a class="MedText" href="00001.JPG">00001.JPG</a>
...
所以我只是在寻找一种简单的方法来检索这些 href 标签,这样我就可以下载该目录中的文件,例如“101DIR00”中的文件。
我可以以字符串形式获取此 html,然后在“href”之后查找字符串,但这似乎是一个漫长乏味的方法。所以只是想知道是否有更简单的方法来检索它。
最佳答案
如果您通过 http 进行查询,那么:不,没有可靠的方法可以做到这一点,并且答案没有实际意义,因为 http 地址越来越多地不会将 1:1 映射到文件无论如何 。例如,看看上面的地址(我的意思是这个页面)。
你可以像机器人一样行事;寻找诸如站点地图之类的东西,否则/或抓取页面。但请注意,攻击性的蜘蛛通常会让您很快被屏蔽。
如果您有权访问服务器的文件系统,只需计算文件数即可。
关于c# - 使用 c# 和/或 java 查找 http 服务器中有多少个文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5535118/