SQL注入的原理解说，挺好！

原文地址：http://www.cnblogs.com/rush/archive/2011/12/31/2309203.html

1.1.1 总结

前几天，国内最大的程序猿社区CSDN网站的用户数据库的黑客公告。600登录名和万用户password被公开泄露，随后又有多家站点的用户password被流传于网络，连日来引发众多网民对自己账号、password等互联网信息被盗取的普遍担忧。

网络安全成为了如今互联网的焦点，这也恰恰触动了每一位用户的神经，因为设计的漏洞导致了不可收拾的恶果，验证了一句话“出来混的，迟早是要还的”，所以我想通过专题博文介绍一些经常使用的攻击技术和防范策略。

SQL Injection或许非常多人都知道或者使用过，假设没有了解或全然没有听过也没有关系。由于接下来我们将介绍SQL Injection。

1.1.2 正文

SQL Injection：就是通过把SQL命令插入到Web表单递交或输入域名或页面请求的查询字符串，终于达到欺骗server运行恶意的SQL命令。

详细来说。它是利用现有应用程序，将（恶意）的SQL命令注入到后台数据库引擎运行的能力。它能够通过在Web表单中输入（恶意）SQL语句得到一个存在安全漏洞的站点上的数据库。而不是依照设计者意图去运行SQL语句。

首先让我们了解什么时候可能发生SQL Injection。

如果我们在浏览器中输入URL www.sample.com，因为它仅仅是对页面的简单请求无需对数据库动进行动态请求。所以它不存在SQL Injection。当我们输入www.sample.com?testid=23时，我们在URL中传递变量testid，而且提供值为23。因为它是对数据库进行动态查询的请求（当中?testid＝23表示数据库查询变量）。所以我们能够该URL中嵌入恶意SQL语句。

如今我们知道SQL Injection适用场合。接下来我们将通过详细的样例来说明SQL Injection的应用。这里我们以pubs数据库作为样例。

我们通过Web页面查询job表中的招聘信息，job表的设计例如以下：

图1 jobs表

接着让我们实现Web程序，它依据工作Id（job_id）来查询对应的招聘信息，示意代码例如以下：

/// <summary>
/// Handles the Load event of the Page control.
/// </summary>
/// <param name="sender">The source of the event.</param>
/// <param name="e">The <see cref="System.EventArgs"/> instance containing the event data.</param>
protected void Page_Load(object sender, EventArgs e)
{
    if (!IsPostBack)
    {
        // Gets departmentId from http request.
        string queryString = Request.QueryString["departmentID"];
        if (!string.IsNullOrEmpty(queryString))
        {
            // Gets data from database.
            gdvData.DataSource = GetData(queryString.Trim());

            // Binds data to gridview.
            gdvData.DataBind();
        }
    }
}

如今我们已经完毕了Web程序。接下来让我们查询对应招聘信息吧。

图2 job表查询结果

如图所看到的。我们要查询数据库中工作Id值为1的工作信息，并且在页面显示了该工作的Id。Description，Min Lvl和Max Lvl等信息。

如今要求我们实现依据工作Id查询对应工作信息的功能，想必大家非常快能够给出解决方式。SQL示意代码例如以下：

SELECT     job_id, job_desc, min_lvl, max_lvl
FROM         jobs
WHERE     (job_id = 1)

如果如今要求我们获取Department表中的全部数据。并且必须保留WHERE语句，那我们仅仅要确保WHERE恒真就OK了。SQL示意代码例如以下：

SELECT     job_id, job_desc, min_lvl, max_lvl
FROM         jobs
WHERE     (job_id = 1) OR 1 = 1

上面我们使得WHERE恒真，所以该查询中WHERE已经不起作用了。其查询结果等同于下面SQL语句。

SELECT     job_id, job_desc, min_lvl, max_lvl
FROM         jobs

SQL查询代码实现例如以下：

string sql1 = string.Format(
    "SELECT job_id, job_desc, min_lvl, max_lvl FROM jobs WHERE job_id='{0}'", jobId);

如今我们要通过页面请求的方式，让数据库运行我们的SQL语句。我们要在URL中嵌入恶意表达式1=1（或2=2等等）。例如以下URL所看到的：

http://localhost:3452/ExcelUsingXSLT/Default.aspx?

jobid=1'or'1'='1

等效SQL语句例如以下：

SELECT     job_id, job_desc, min_lvl, max_lvl
FROM         jobs
WHERE     job_id = '1' OR '1' = 1'

图3 job表查询结果

如今我们把job表中的全部数据都查询出来了。只通过一个简单的恒真表达式就能够进行了一次简单的攻击。

尽管我们把job表的数据都查询出来了，但数据并没有太大的价值。因为我们把该表暂时命名为job表。所以接着我们要找出该表真正表名。

首先我们如果表名就是job。然后输入下面URL：

http://localhost:3452/ExcelUsingXSLT/Default.aspx?

jobid=1'or 1=(select count(*) from job)--

等效SQL语句例如以下：

SELECT       job_id, job_desc, min_lvl, max_lvl 
FROM         jobs 
WHERE      job_id='1'or 1=(select count(*) from job) --'

图4 job表查询结果

当我们输入了以上URL后。结果server返回我们错误信息，这证明了我们的如果是错误的。那我们该感觉到挫败吗？不，事实上这里返回了非常多信息，首先它证明了该表名不是job，并且它还告诉我们后台数据库是SQL Server，不是MySQL或Oracle，这也设计一个漏洞把错误信息直接返回给了用户。

接下假定表名是jobs。然后输入下面URL：

http://localhost:3452/ExcelUsingXSLT/Default.aspx?

jobid=1'or1=(select count(*) from jobs) --

等效SQL语句例如以下：

SELECT       job_id, job_desc, min_lvl, max_lvl 
FROM         jobs 
WHERE      job_id='1'or 1=(select count(*) from jobs) --'

图5 job表查询结果

如今证明了该表名是jobs。这能够迈向成功的一大步，因为我们知道了表名就能够对该表进行增删改操作了。并且我们还能够推測出很多其它的表对它们作出改动，一旦改动成功那么这将是一场灾难。

如今大家已经对SQL Injection的攻击有了初步的了解了。接下让我们学习怎样防止SQL Injection。

总的来说有下面几点：

1.永远不要信任用户的输入，要对用户的输入进行校验。能够通过正則表達式，或限制长度，对单引號和双"-"进行转换等。

2.永远不要使用动态拼装SQL。能够使用參数化的SQL或者直接使用存储过程进行数据查询存取。

3.永远不要使用管理员权限的数据库连接，为每一个应用使用单独的权限有限的数据库连接。

4.不要把机密信息明文存放。请加密或者hash掉password和敏感的信息。

5.应用的异常信息应该给出尽可能少的提示，最好使用自己定义的错误信息对原始错误信息进行包装，把异常信息存放在独立的表中。

通过正则表达校验用户输入

首先我们能够通过正則表達式校验用户输入数据中是包括：对单引號和双"-"进行转换等字符。

然后继续校验输入数据中是否包括SQL语句的保留字。如：WHERE。EXEC，DROP等。

如今让我们编写正則表達式来校验用户的输入吧。正則表達式定义例如以下：

private static readonly Regex RegSystemThreats =
        new Regex(@"\s?or\s*|\s?;\s?
|\s?drop\s|\s?grant\s|^'|\s?--|\s?union\s|\s?delete\s|\s?truncate\s|" +
            @"\s?
sysobjects\s?|\s?xp_.*?|\s?
syslogins\s?|\s?
sysremote\s?|\s?sysusers\s?|\s?
sysxlogins\s?
|\s?sysdatabases\s?|\s?aspnet_.*?|\s?exec\s?",
            RegexOptions.Compiled | RegexOptions.IgnoreCase);

上面我们定义了一个正則表達式对象RegSystemThreats，而且给它传递了校验用户输入的正則表達式。

因为我们已经完毕了对用户输入校验的正則表達式了，接下来就是通过该正則表達式来校验用户输入是否合法了。因为.NET已经帮我们实现了推断字符串是否匹配正則表達式的方法——IsMatch()，所以我们这里仅仅需给传递要匹配的字符串就OK了。

示意代码例如以下：

/// <summary>
/// A helper method to attempt to discover [known] SqlInjection attacks.  
/// </summary>
/// <param name="whereClause">string of the whereClause to check</param>
/// <returns>true if found, false if not found </returns>
public static bool DetectSqlInjection(string whereClause)
{
    return RegSystemThreats.IsMatch(whereClause);
}

/// <summary>
/// A helper method to attempt to discover [known] SqlInjection attacks.  
/// </summary>
/// <param name="whereClause">string of the whereClause to check</param>
/// <param name="orderBy">string of the orderBy clause to check</param>
/// <returns>true if found, false if not found </returns>
public static bool DetectSqlInjection(string whereClause, string orderBy)
{
    return RegSystemThreats.IsMatch(whereClause) || RegSystemThreats.IsMatch(orderBy);
}

如今我们完毕了校验用的正則表達式，接下来让我们须要在页面中加入校验功能。

/// <summary>
/// Handles the Load event of the Page control.
/// </summary>
/// <param name="sender">The source of the event.</param>
/// <param name="e">The <see cref="System.EventArgs"/> instance containing the event data.</param>
protected void Page_Load(object sender, EventArgs e)
{
    if (!IsPostBack)
    {
        // Gets departmentId from http request.
        string queryString = Request.QueryString["jobId"];
        if (!string.IsNullOrEmpty(queryString))
        {
            if (!DetectSqlInjection(queryString) && !DetectSqlInjection(queryString, queryString))
            {
                // Gets data from database.
                gdvData.DataSource = GetData(queryString.Trim());

                // Binds data to gridview.
                gdvData.DataBind();
            }
            else
            {
                throw new Exception("Please enter correct field");
            }
        }
    }
}

当我们再次运行下面URL时。被嵌入的恶意语句被校验出来了。从而在一定程度上防止了SQL Injection。

http://localhost:3452/ExcelUsingXSLT/Default.aspx?jobid=1'or'1'='1

图6 加入校验查询结果

但使用正則表達式仅仅能防范一些常见或已知SQL Injection方式，并且每当发现有新的攻击方式时，都要对正則表達式进行改动，这但是吃力不讨好的工作。

通过參数化存储过程进行数据查询存取

首先我们定义一个存储过程依据jobId来查找jobs表中的数据。

-- =============================================
-- Author:        JKhuang
-- Create date: 12/31/2011
-- Description:    Get data from jobs table by specified jobId.
-- =============================================
ALTER PROCEDURE [dbo].[GetJobs]
    -- ensure that the id type is int
    @jobId INT
AS
BEGIN
--    SET NOCOUNT ON;
    SELECT job_id, job_desc, min_lvl, max_lvl
    FROM dbo.jobs
    WHERE job_id = @jobId
    GRANT EXECUTE ON GetJobs TO pubs 
END

接着改动我们的Web程序使用參数化的存储过程进行数据查询。

using (var com = new SqlCommand("GetJobs", con))
{
    // Uses store procedure.
    com.CommandType = CommandType.StoredProcedure;

    // Pass jobId to store procedure.
    com.Parameters.Add("@jobId", SqlDbType.Int).Value = jobId;
    com.Connection.Open();
    gdvData.DataSource = com.ExecuteScalar();
    gdvData.DataBind(); 
}

如今我们通过參数化存储过程进行数据库查询，这里我们把之前加入的正則表達式校验凝视掉。

图7 存储过程查询结果

大家看到当我们试图在URL中嵌入恶意的SQL语句时，參数化存储过程已经帮我们校验出传递给数据库的变量不是整形。并且使用存储过程的优点是我们还能够非常方便地控制用户权限，我们能够给用户分配仅仅读或可读写权限。

但我们想想真的有必要每一个数据库操作都定义成存储过程吗？并且那么多的存储过程也不利于日常的维护。

參数化SQL语句

还是回到之前动态拼接SQL基础上，我们知道一旦有恶意SQL代码传递过来。并且被拼接到SQL语句中就会被数据库运行，那么我们能否够在拼接之前进行推断呢？——命名SQL參数。

string sql1 = string.Format("SELECT job_id, job_desc, min_lvl, max_lvl FROM jobs WHERE job_id = @jobId");
using (var con = new SqlConnection(ConfigurationManager.ConnectionStrings["SQLCONN1"].ToString()))
using (var com = new SqlCommand(sql1, con))
{
    // Pass jobId to sql statement.
    com.Parameters.Add("@jobId", SqlDbType.Int).Value = jobId;
    com.Connection.Open();
    gdvData.DataSource = com.ExecuteReader();
    gdvData.DataBind(); 
}

图8 參数化SQL查询结果

这样我们就能够避免每一个数据库操作（尤其一些简单数据库操作）都编写存储过程了，并且当用户具有数据库中jobs表的读权限才干够运行该SQL语句。

加入新架构

数据库架构是一个独立于数据库用户的非反复命名空间，您能够将架构视为对象的容器（类似于.NET中的命名空间）。

首先我们右击架构目录。然后新建架构。

图9 加入HumanResource架构

上面我们完毕了在pubs数据库中加入HumanResource架构。接着把jobs表放到HumanResource架构中。

图 10 改动jobs表所属的架构

当我们再次执行下面SQL语句时。SQL Server提示jobs无效，这是到底什么原因呢？之前还执行的好好的。

SELECT job_id, job_desc, min_lvl, max_lvl FROM jobs

图 11 查询输出

当我们输入完整的表名“架构名.对象名”（HumanResource.jobs）时，SQL语句运行成功。

SELECT job_id, job_desc, min_lvl, max_lvl FROM HumanResource.jobs

为什么之前我们运行SQL语句时不用输入完整表名dbo.jobs也能够运行呢？

这是由于默认的架构（default schema）是dbo，当仅仅输入表名时，Sql Server会自己主动加上当前登录用户的默认的架构（default schema）——dbo。

因为我们使用自己定义架构，这也减少了数据库表名被推測出来的可能性。

LINQ to SQL

前面使用了存储过程和參数化查询，这两种方法都是非经常常使用的。而针对于.NET Framework的ORM框架也有非常多。如：NHibernate，Castle和Entity Framework，这里我们使用比較简单LINQ to SQL。

图 12 加入jobs.dbml文件

var dc = new pubsDataContext();
int result;

// Validates jobId is int or not.
if (int.TryParse(jobId, out result))
{
    gdvData.DataSource = dc.jobs.Where(p => p.job_id == result);
    gdvData.DataBind();
}

相比存储过程和參数化查询。LINQ to SQL我们仅仅需加入jobs.dbml，然后使用LINQ对表进行查询就OK了。

1.1.3 总结

我们在本文中介绍了SQL Injection的基本原理，通过介绍什么是SQL Injection，如何进行SQL Injection和如何防范SQL Injection。通过一些程序的源代码SQL这次袭击是经过精心分析。它使我们SQL Injection随着深入了解的机制，作为一个Web应用程序开发。切不可盲目相信用户输入，由用户输入的数据是严重格验证过程。否则。SQL Injection会有意想不到。

最后。新年快乐。健康。Code with pleasure。

posted @ 2015-06-08 19:12 hrhguanli 阅读(257) 评论(0) 编辑收藏举报

刷新页面返回顶部