How to detect whether HTML content, when rendered, is blank/whitespace?
考虑如下代码:
1
2 3 |
<!– comment –>
<span></span><br /> <span class=”foo”></span> |
在浏览器上会有效地呈现为一段空白。
我想知道,给定那个或类似的标记,是否有一种直接的、编程的方式来检测这个去掉空格的代码的最终结果是一个空字符串。
这里的实现是 JavaScript,但我也对更通用的(与语言无关的)解决方案感兴趣,如果存在的话。
请注意,仅删除标签并查看是否有任何文本不是真正的解决方法,因为有很多标签最终会呈现可见内容(例如 img、hr 等)。
- 您可以使用 CSS 将内容呈现到页面,仅查看标记可能还不够
- 使用 DOM API,有一个你认为是空白的字符列表,递归地确认任何给定节点的唯一内容是否是空白文本(或节点是评论等),如果是,则删除该节点;如果你没有节点,那都是空白。 a€”请注意,例如,这不会捕获白色背景上的白色文本a€|
这是我想出的答案。它使用假定在页面上呈现的标签白名单,无论它们是否有内容,所有其他标签都假定只有在它们具有实际文本内容时才会呈现。一旦你有了它,实际上解决方案就相当简单了,因为它依赖于 innerText 属性自动删除所有标签这一事实。
此解决方案还忽略基于 CSS 呈现的元素(例如,具有背景颜色的块或为 :after 或 :before 伪元素设置内容的块)但幸运的是,这与我的用例无关.
1
2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 |
function htmlIsWhitespace(input) {
\tvar visible = [ \t\t\t’img’,’iframe’,’object’,’hr’, \t\t\t’audio’, ‘video’, \t\t\t’form’, ‘button’, ‘input’, ‘select’, ‘textarea’ \t\t], \t\tcontainer = document.createElement(‘div’); \tcontainer.innerHTML = input; \treturn !(container.innerText.trim().length > 0 || container.querySelector(visible.join(‘,’))); } // And the tests (I believe these are comprehensive): var testStringsYes = [ <li> </li> </ul> for(var yy=0, yl=testStringsYes.length; yy < yl; yy += 1) { for(var nn=0, nl=testStringsNo.length; nn < nl; nn += 1) { |
来源:https://www.codenong.com/44675983/