如何防止页面中的敏感信息被提取
公布到网页上的Email经常会被一些工具自动提取,一些非法用户就会利用所提取的Email大肆发送垃圾邮件。这些工具大多都是查找链接中 “mailto:”后面的信息或是“@”前后的信息来达到提取Email的目的。我在看DotNetNuke(以下简称DNN)的源代码时发现了一个不错 的方式来防止这些信息被自动提取。
在DNN中有这么一段函数(Globals.vb中):
Public Function CloakText(ByVal PersonalInfo As String) As String
If Not PersonalInfo Is Nothing Then
Dim sb As New StringBuilder
' convert to ASCII character codes,将字符串转换成ASCII编码字符串形式
sb.Remove(0, sb.Length)
Dim StringLength As Integer = PersonalInfo.Length - 1
For i As Integer = 0 To StringLength
sb.Append(Asc(PersonalInfo.Substring(i, 1)).ToString)
If i < StringLength Then
sb.Append(",")
End If
Next
' build script block
Dim sbScript As New StringBuilder
sbScript.Append(vbCrLf & "<script language=""javascript"">" & vbCrLf)
sbScript.Append("<!-- " & vbCrLf)
'fromCharCode 方法:从一些 Unicode 字符值中返回一个字符串。
sbScript.Append(" document.write(String.fromCharCode(" & sb.ToString & "))" & vbCrLf)
sbScript.Append("// -->" & vbCrLf)
sbScript.Append("</script>" & vbCrLf)
Return sbScript.ToString
Else
Return Null.NullString
End If
End Function
C#代码如下:
private string CloakText(string text)
{
StringBuilder sb = new StringBuilder();
System.Text.ASCIIEncoding asciiEncoding = new ASCIIEncoding();
byte[] bytes = new byte[text.Length];
int count = asciiEncoding.GetBytes(text,0,text.Length,bytes,0);
for(int i=0;i<count;i++)
{
sb.Append((int)bytes[i]);
if(i<count-1)
{
sb.Append(",");
}
}
return sb.ToString();
}
--------------------------------------------------------------------------------------------------------
该段代码先将需要加密的信息转换成ASCII编码字符串形式,然后用javascript中的document.write方法写到页面。
我测试了以下效果,还不错。大家也可以试试。
<head>
<meta http-equiv="Content-Type" content="text/html; charset=gb2312">
<title>测试信息加密</title>
</head>
<body>
可以被提取的链接:<a href="mailto:aaa@163.com">aaa@163.com</a><br>
不能被提取的链接:
<script language="javascript">
<!--
document.write(String.fromCharCode(60,97,32,104,114,101,102,61,34,109,97,105,108,116,111,58,120,120,120,64,116,111,109,46,99,111,109,34,62,120,120,120,64,116,111,109,46,99,111,109,60,47,97,62))
// -->
</script>
</body>
</html>
如果大家有兴趣,还可以用更加复杂的方法来进行加密,一句话:再也不能让人轻易获取信息了!
这个不是防破解的,作用是防止蜘蛛偷用户EMAIL等信息发拉圾用的。因此跟破解没有关系。