[开发实录]小爱同学课程表 - 强智系统与HEU教务系统的开发

不得不说,小爱课程表这个功能是十分好用的。特别是每天在室友面前喊“小爱同学,明天有什么课”,结合MIUI的AI助理技术,能让室友体会柠檬的酸味(doge)。

然而某些学校可能暂时没有适配该系统导致导入课程表失败,这不要紧,只需要一点点JS知识以及一点点jQuery知识,加上三四天,你也可以搞出自己学校的课程表适配(当然某些奇形怪状的课程表除外)

 

声明:本项目适配 湖南强智科技教务系统

一、项目地址/参考

  项目位于仓库:https://github.com/Holit/HEU_edusys_miui

  项目里已经包含了网页文件,是我的课程表,可以在web_ref内找到

  官方文档:https://ldtu0m3md0.feishu.cn/docs/doccnhZPl8KnswEthRXUz8ivnhb

二、详细教程

  0x00 开始工作

    配置Chrome开发环境

    1. 按照要求下载Chrome插件:https://cnbj1.fds.api.xiaomi.com/aife/AISchedule/AISchedule.zip

    2. 下载Chrome,打开链接 chrome://extensions/ ,打开开发者模式,导入AISchedule DevTools文件夹。

    如果成功可以看到

    准备开始开发

    1. 定向到教务网站系统,笔者这里以哈尔滨工程大学(下称HEU)本科生教务系统为例

    

 

 

     2.在此页右键,打开Chrome检查页。亦可以按下Ctrl+Shift+I启动检查页。之后定位到AISchedule标签

 

 

 

 

 

     2. 点击右上角进行登录,此处登陆的是自己的小米账号,便于以后的E2E测试和项目保存、同步

 

 

     3.成功登录之后关闭检查页再打开,就可以看到左侧的开发版面已经更新。如果是第一次创建本校的课程表端口,左侧可能是空的。

      点击左侧“添加”,弹出“适配项目”窗口

 

 

     按照要求填写相关内容,注意这里的教务系统url最好填成外网URL(即非ip地址形式)

    4.新建后可以看到

 

 

     点击这个选项卡内部,浏览器自动切换到Sources选项卡。此时开发环境配置结束

  0x01 准备Provider

    Provider的作用在于从指定的教务系统url获取页面文档并传递给Praser。

    为了适配HEU的教务系统,我们使用GET方法。GET是一个HTTP方法,目的是从指定的资源请求数据。

此处我的Provider代码如下

1 function scheduleHtmlProvider(iframeContent = "", frameContent = "", dom = document) {
2   let http = new XMLHttpRequest()
3   http.open('GET', '/jsxsd/xskb/xskb_list.do?Ves632DSdyV=NEW_XSD_PYGL', false)
4   http.send()
5   return http.responseText
6 }

    代码说明:

      函数体

1 function scheduleHtmlProvider(iframeContent = "", frameContent = "", dom = document) {
2 }

      是默认函数体,在官方文档中给出的示例为

 1 function scheduleHtmlProvider(iframeContent = "", frameContent = "", dom = document) {
 2     //除函数名外都可编辑
 3     //以下为示例,您可以完全重写或在此基础上更改
 4 
 5     const ifrs = dom.getElementsByTagName("iframe");
 6     const frs = dom.getElementsByTagName("frame");
 7 
 8     if (ifrs.length) {
 9         for (let i = 0; i < ifrs.length; i++) {
10             const dom = ifrs[i].contentWindow.document;
11             iframeContent += scheduleHtmlProvider(iframeContent, frameContent, dom);
12         }
13     }
14     if (frs.length) {
15         for (let i = 0; i < frs.length; i++) {
16             const dom = frs[i].contentDocument.body.parentElement;
17             frameContent += scheduleHtmlProvider(iframeContent, frameContent, dom);
18         }
19     }
20     if (!ifrs.length && !frs.length) {
21         return dom.querySelector('body').outerHTML
22     }
23     return dom.getElementsByTagName('html')[0].innerHTML + iframeContent + frameContent
24 }

    要查看获取的结果是不是正确,需要在Praser里查看是不是传递了正确的参数。

  0x2 编写Praser

    Praser主要工作在于解析Provider传入的参数并将该解析结果传出。该函数接受html作为参数,传出一个list

    官方docs给出的示例为

 1 function scheduleHtmlParser(html) {
 2     //除函数名外都可编辑
 3     //传入的参数为上一步函数获取到的html
 4     //可使用正则匹配
 5     //可使用解析dom匹配,工具内置了$,跟jquery使用方法一样,直接用就可以了,参考:https://juejin.im/post/5ea131f76fb9a03c8122d6b9
 6     //以下为示例,您可以完全重写或在此基础上更改
 7     let result = []
 8     let bbb = $('#table1 .timetable_con')
 9         for (let u = 0; u < bbb.length; u++) {
10             let re = {
11                 sections: [],
12                 weeks: []
13             }
14             let aaa = $(bbb[u]).find('span')
15                 let week = $(bbb[u]).parent('td')[0].attribs.id
16                 if (week) {
17                     re.day = week.split('-')[0]
18                 }
19                 for (let i = 0; i < aaa.length; i++) {
20 
21                     if (aaa[i].attribs.title == '上课地点') {
22 
23                         for (let j = 0; j < $(aaa[i]).next()[0].children.length; j++) {
24                             re.position = $(aaa[i]).next()[0].children[j].data
25                         }
26                     }
27                     if (aaa[i].attribs.title == '节/周') {
28 
29                         for (let j = 0; j < $(aaa[i]).next()[0].children.length; j++) {
30 
31                             let lesson = $(aaa[i]).next()[0].children[j].data
32                                 for (let a = Number(lesson.split(')')[0].split('(')[1].split('-')[0]); a < Number(lesson.split(')')[0].split('(')[1].split('-')[1].split('节')[0]) + 1; a++) {
33 
34                                     re.sections.push({
35                                         section: a
36                                     })
37                                 }
38                                 for (let a = Number(lesson.split(')')[1].split('-')[0]); a < Number(lesson.split(')')[1].split('-')[1].split('周')[0]) + 1; a++) {
39 
40                                     re.weeks.push(a)
41                                 }
42                         }
43                     }
44 
45                     if (aaa[i].attribs.title == '教师') {
46 
47                         for (let j = 0; j < $(aaa[i]).next()[0].children.length; j++) {
48                             re.teacher = $(aaa[i]).next()[0].children[j].data
49                         }
50                     }
51 
52                     if (aaa[i].attribs.class == 'title') {
53 
54                         for (let j = 0; j < $(aaa[i]).children()[0].children.length; j++) {
55                             re.name = $(aaa[i]).children()[0].children[j].data
56 
57                         }
58                     }
59 
60                 }
61                 result.push(re)
62         }
63         console.log(result)
64 
65         return {
66         courseInfos: result
67     }
68 }

    我们发现这个示例并不能很好的适配我们的教务系统,因此我们开始从零编写这个Praser。

  1x00 分析文档结构

    TODO:一步步筛选Html的内容,并让内容最终精简到我们所需要的文本。

    这里我们使用jQuery,当然你也可以使用正则表达式进行匹配

    这里我们分析Elements选项卡,在课程内容上右键

 

 

     展开对应元素的html设计

 

 

     Chrome已经帮我们定位了这个元素的div,我们展开慢慢查询

 

 

     观察元素,可以发现这个html中我们想获取的内容都有如下代码环绕:(删去了</div>等结构)

1 <table id="kbtable" border="1" width="100%" cellspacing="0" cellpadding="0" class="Nsb_r_list Nsb_table">
2 <div id="5180478CC0C746CC94534AF06163E808-3-2" style="" class="kbcontent">线性代数与解析几何A<br><font title="老师">廉春波</font><br><font title="周次">4-18(周)</font><br><font title="节次">[0102节]</font><br><font title="教室">21B 502中</font><br></div>

    因此,我们所希望定位的内容位于一个table里,这个table的id是kbtable。这个table的内部存在一个class为kbcontent的div。

    此时我们要应用jQuery大法获取这段内容。

  1x01 jQuery介绍

    1.jQuery 选择器

      jQuery 选择器允许您对 HTML 元素组或单个元素进行操作。基于元素的 id、类、类型、属性、属性值等"查找"(或选择)HTML 元素。 它基于已经存在的 CSS 选择器,除此之外,它还有一些自定义的选择器。

      jQuery 中所有选择器都以美元符号开头:$()。

    2.#id 选择器

      jQuery #id 选择器通过 HTML 元素的 id 属性选取指定的元素。

      页面中元素的 id 应该是唯一的,所以您要在页面中选取唯一的元素需要通过 #id 选择器。

      通过 id 选取元素语法如下:

1 $("#test")

    3..class 选择器

      jQuery 类选择器可以通过指定的 class 查找元素。

      语法如下:

1 $(".test")

    4.更多语法

 1 $("*")    //选取所有元素    
 2 $(this)    //选取当前 HTML 元素    
 3 $("p.intro")    //选取 class 为 intro 的 <p> 元素    
 4 $("p:first")    //选取第一个 <p> 元素    
 5 $("ul li:first")    //选取第一个 <ul> 元素的第一个 <li> 元素    
 6 $("ul li:first-child")    //选取每个 <ul> 元素的第一个 <li> 元素    
 7 $("[href]")    //选取带有 href 属性的元素    
 8 $("a[target='_blank']")    //选取所有 target 属性值等于 "_blank" 的 <a> 元素    
 9 $("a[target!='_blank']")    //选取所有 target 属性值不等于 "_blank" 的 <a> 元素    
10 $(":button")    //选取所有 type="button" 的 <input> 元素 和 <button> 元素    
11 $("tr:even")    //选取偶数位置的 <tr> 元素    
12 $("tr:odd")    //选取奇数位置的 <tr> 元素    

    1x02 正则表达式语法简介

      由于本项目不使用正则表达式,因此我不会详细讲解这部分。这段内容留给您参考

      正则表达式测试:https://tool.oschina.net/regex/

      语法:http://c.biancheng.net/view/5632.html

    1x03 使用jQuery获取元素

      我们分析了我们想要的东西的父节点id为kbtable,class为kbcontent。因此我们写出下述jQuery代码

1     let $raw = $('#kbtable .kbcontent').toArray();

      为了便于之后我查看和引用变量,我在所有jQuery获取的变量前面都加上了$以标示它的来源是jQuery。

      此处加不加.toArray()都可以,因为返回的就是一个Object数组,它长这样

 

 

 

     ps:如果要进行运行时调试,你可以使用console.info()。鉴于console.log()在移动端不可用,我建议一楼都使用info,发布时再去掉。当然去不去掉没关系。

    我们看到,这个数组刚好返回了35个值。这个值满足5*7=35,也就是说7天,每天5节课都被包含在这个list内部。我们展开一个object查看

 

 

      很不幸这个元素内没有符合要求的信息。但这并不代表我们错了,而是这节本来就没课。

    如果我们展开第2个元素:

 

 

     熟悉的线代老师名字出现了!(逃

    这里我们分析这个Object就会发现这玩意真是符合哈尔滨风格,一层套一层(没有贬低哈尔滨的意思

  1x04 分析元素并启动筛选

    接下来就是整个适配系统中的核心部分,即适配这些children。这个时候你就会遇到一堆又一堆的坑。让我们开始吧。

    第一,我们首先要检查我们访问的Object是不是存在,因为如果不存在我们是无法对其进行操作、读取以及获取children的。因此我们加上

1     for (index in $raw) {
2         data = $raw[index]
3         if (data.children != undefined) {
4             if (data.children.length == 1) {
5                 continue;
6             }
7         }
8     }
9 }

    代码说明:

    我们对$raw的每个元素都检查一边,如果$raw其中的某个Object有children的话,就检查这个children是不是为空。

    如果为空,就说明这节没课。

    第二个坑此时出现了,HEU的课程表有一个奇怪的不知道为什么这样写的东西,也就是

 

 

 

 

     这一节课相同老师相同时间不同教室????

    实际上这是一节主播课程,也就是一间主播教室,几间不同的录播教室。又由于每节课地点不同,因此每节课上课前班长才会通知具体上课地点。因此我们无法处理这个课程。

    我们添加下述逻辑

1             if (data.children.length == 12) {
2                 name = name + '[待定]';
3             }

    这段逻辑是说,如果数据的长度是12的话,说明是这样的录播课,我们便在这节课的课名后面加上一个“待定”来区别。

    ...

    经历了各项痛苦的逻辑查询和运行时调试,我们得到下述代码访问所需要的内容

1             //please notice these data are from object, therefore please check whether they are existed.
2             //for rigorous, please check undefined
3             teacher = data.children[2].children[0].data;
4             weeks = data.children[4].children[0].data;
5             sections = data.children[6].children[0].data;
6             position = data.children[8].children[0].data;

  1x05 文本分析和输出正确的数据格式

    1.数据格式要求

      根据官方文档,要求输出下述两个数据:courses和sections,这里先讲courses,sections将在2x00开始讲。

      

 

       示例为

  1 示例
  2 {
  3     "courseInfos": [
  4       {
  5         "name": "数学",
  6         "position": "教学楼1",
  7         "teacher": "张三",
  8         "weeks": [
  9           1,
 10           2,
 11           3,
 12           4,
 13           5,
 14           6,
 15           7,
 16           8,
 17           9,
 18           10,
 19           11,
 20           12,
 21           13,
 22           14,
 23           15,
 24           16,
 25           17,
 26           18,
 27           19,
 28           20
 29         ],
 30         "day": 3,
 31         "sections": [
 32           {
 33             "section": 2,
 34             "startTime": "08:00",//可不填
 35             "endTime": "08:50"//可不填
 36           }
 37         ],
 38       },
 39       {
 40         "name": "语文",
 41         "position": "基础楼",
 42         "teacher": "荆州",
 43         "weeks": [
 44           1,
 45           2,
 46           3,
 47           4,
 48           5,
 49           6,
 50           7,
 51           8,
 52           9,
 53           10,
 54           11,
 55           12,
 56           13,
 57           14,
 58           15,
 59           16,
 60           17,
 61           18,
 62           19,
 63           20
 64         ],
 65         "day": 2,
 66         "sections": [
 67           {
 68             "section": 2,
 69             "startTime": "08:00",//可不填
 70             "endTime": "08:50"//可不填
 71           },
 72           {
 73             "section": 3,
 74             "startTime": "09:00",//可不填
 75             "endTime": "09:50"//可不填
 76           }
 77         ],
 78       }
 79     ],
 80     "sectionTimes": [
 81       {
 82         "section": 1,
 83         "startTime": "07:00",
 84         "endTime": "07:50"
 85       },
 86       {
 87         "section": 2,
 88         "startTime": "08:00",
 89         "endTime": "08:50"
 90       },
 91       {
 92         "section": 3,
 93         "startTime": "09:00",
 94         "endTime": "09:50"
 95       },
 96       {
 97         "section": 4,
 98         "startTime": "10:10",
 99         "endTime": "11:00"
100       },
101       {
102         "section": 5,
103         "startTime": "11:10",
104         "endTime": "12:00"
105       },
106       {
107         "section": 6,
108         "startTime": "13:00",
109         "endTime": "13:50"
110       },
111       {
112         "section": 7,
113         "startTime": "14:00",
114         "endTime": "14:50"
115       },
116       {
117         "section": 8,
118         "startTime": "15:10",
119         "endTime": "16:00"
120       },
121       {
122         "section": 9,
123         "startTime": "16:10",
124         "endTime": "17:00"
125       },
126       {
127         "section": 10,
128         "startTime": "17:10",
129         "endTime": "18:00"
130       },
131       {
132         "section": 11,
133         "startTime": "18:40",
134         "endTime": "19:30"
135       },
136       {
137         "section": 12,
138         "startTime": "19:40",
139         "endTime": "20:30"
140       },
141       {
142         "section": 13,
143         "startTime": "20:40",
144         "endTime": "21:30"
145       }
146     ]
147   }
示例结构

      注意这里有个坑:

      sections的结构为

 1 "sections": [
 2           {
 3             "section": 2,
 4             "startTime": "08:00",//可不填
 5             "endTime": "08:50"//可不填
 6           },
 7           {
 8             "section": 3,
 9             "startTime": "09:00",//可不填
10             "endTime": "09:50"//可不填
11           }
12         ],

      也就是说元素sections是一个list,包含了节数信息和课程开始、节数时间信息。不要填成

"sections":{1,2,3}

      这是不通过的。

    2.输出正确的数据格式

      首先我们要解析文本数据,即“周”和“节次”数据,他们原本是这样的:5-18(周)、[030405节],我们要搞成上面要求的样子

      因此我借鉴了我们学校研究生系统中的一个function:

 1 function _create_array(rangeNum) {
 2     //rangeNum should be inputed as '7-18' and will output {7,8,9,10,11,12,13,14,15,16,17,18}
 3     let resultArray = [];
 4     let begin = rangeNum.split('-')[0];
 5     let end = rangeNum.split('-')[1];
 6     for (let i = Number(begin); i <= Number(end); i++) {
 7         resultArray.push(i);
 8     }
 9     return resultArray;
10 }

      这段function将接受一个str作为参数,参数标记为"?-?"。之后输出一个数组,这个数组是参数对应的数组。

      例如输入"7-18",输出{7,8,9,10,11,12,13,14,15,16,17,18}

      这样我们就能处理5-18这样的数字了,然而我们发现有些周数是分开的,即,4,5-18。这很简单,我们只需要分割字符串就好。注意,这里要求的传入必须去掉"(周)",这只需要replace就可以了

      最终我们得到函数

 1 function _get_week(data) {
 2     //weeks data will be inputed as '4,7-18', to handle ,we will split them by ',' and operate seperately.
 3     let result = [];
 4     let raw = data.split(',');
 5     for (i in raw) {
 6 
 7         if (raw[i].indexOf('-') == -1) {
 8             //create array
 9             result.push(parseInt(raw[i]));
10         } else {
11             let begin = raw[i].split('-')[0];
12             let end = raw[i].split('-')[1];
13             for (let i = parseInt(begin); i <= parseInt(end); i++) {
14                 result.push(i);
15             }
16         }
17     }
18     //sort the array,
19     return result.sort(function (a, b) {
20         return a - b
21     });
22 
23 }

      为了美观,最后我排了个序。

      观察节数信息,我们发现"01020304"是主要信息,因此我们把它筛选出来,即replace其他的固定字符得到这样的文本。

      我们使用str的索引获取这些节数信息并输出array:

 1 function _get_section(data) {
 2     //section info will be inputed as '01020304',we will devide them into {01,02,03,04} and then create array.
 3     let section = []
 4     let num = 0;
 5     let i = 0;
 6     do {
 7         num = parseInt(data.substr(i, 2));
 8         //this will push an array such as {section:1},{section:2}...
 9         section.push({"section":num});
10         //jump to next number, such as
11         //010203
12         //|
13         //  |
14         i = i + 2;
15     } while (i < data.length);
16     return section;
17 }

    3.

      综上,我们得到下述数据格式处理代码:

//replace for creating the arry
            weeks=weeks.replace('(周)', '');
            sections = sections.replace('[', '');
            sections = sections.replace('节]', '');
            //correct structure.
            let courseInfo = {
                "name": name,
                "position": position,
                "day": _get_day(index),
                "teacher": teacher,
                "sections":_get_section(sections),
                "weeks": _get_week(weeks)
            };
            courses.push(courseInfo);

  2x00 sections

    这个就太简单了,复制下述代码改一改就好,这里是按照HEU的军工作息时间搞的

 1 function createSectionTimes() {
 2     //this is the HEU standard section time.
 3     //get it on the official website.
 4     let sectionTimes = [{
 5             "section": 1,
 6             "startTime": "08:00",
 7             "endTime": "08:45"
 8         }, {
 9             "section": 2,
10             "startTime": "08:50",
11             "endTime": "09:35"
12         }, {
13             "section": 3,
14             "startTime": "09:55",
15             "endTime": "10:40"
16         }, {
17             "section": 4,
18             "startTime": "10:45",
19             "endTime": "11:30"
20         }, {
21             "section": 5,
22             "startTime": "11:35",
23             "endTime": "12:20"
24         }, {
25             "section": 6,
26             "startTime": "13:30",
27             "endTime": "14:15"
28         }, {
29             "section": 7,
30             "startTime": "14:20",
31             "endTime": "15:05"
32         }, {
33             "section": 8,
34             "startTime": "15:25",
35             "endTime": "16:10"
36         }, {
37             "section": 9,
38             "startTime": "16:15",
39             "endTime": "17:00"
40         }, {
41             "section": 10,
42             "startTime": "17:05",
43             "endTime": "17:50"
44         }, {
45             "section": 11,
46             "startTime": "18:30",
47             "endTime": "19:15"
48         }, {
49             "section": 12,
50             "startTime": "19:20",
51             "endTime": "20:05"
52         }, {
53             "section": 13,
54             "startTime": "20:10",
55             "endTime": "20:55"
56         }
57     ]
58     return sectionTimes
59 }

    3x00 最终成型

      经过上面的编写和调试,我们得到下述代码

 1 function scheduleHtmlParser(html) {
 2     //analyse the element and you will see this.
 3     /*
 4     <div id="5180478CC0C746CC94534AF06163E808-3-2" style="" class="kbcontent">
 5     线性代数与解析几何A<br>
 6         <font title="老师">廉春波</font><br>
 7         <font title="周次">4-18(周)</font><br>
 8         <font title="节次">[0102节]</font><br>
 9         <font title="教室">21B 502中</font><br>
10     </div>
11 
12     this is the main entrance.
13     */    
14     let $raw = $('#kbtable .kbcontent').toArray();
15     console.info($raw);
16     let courses = [];
17 
18     let name = "";
19     let teacher = "";
20     let weeks = "";
21     let sections = "";
22     let position = "";
23 
24     for (index in $raw) {
25         data = $raw[index]
26         if (data.children != undefined) {
27             if (data.children.length == 1) {
28                 continue;
29             }
30             name = data.children[0].data;
31             //for courses includes '---------------------' which I dont understand, thier array will be longer than others, therefore we use length to flag them.
32             //reminder:courses includes '---------------------' will be only different in the position, and the position is not determined until its going to begin.
33             //therefore we use '[待定]' to mark them out.
34             if (data.children.length == 12) {
35                 name = name + '[待定]';
36             }
37 
38             //please notice these data are from object, therefore please check whether they are existed.
39             //for rigorous, please check undefined
40             teacher = data.children[2].children[0].data;
41             weeks = data.children[4].children[0].data;
42             sections = data.children[6].children[0].data;
43             position = data.children[8].children[0].data;
44             
45             //replace for creating the arry
46             weeks=weeks.replace('(周)', '');
47             sections = sections.replace('[', '');
48             sections = sections.replace('节]', '');
49             //correct structure.
50             let courseInfo = {
51                 "name": name,
52                 "position": position,
53                 "day": _get_day(index),
54                 "teacher": teacher,
55                 "sections":_get_section(sections),
56                 "weeks": _get_week(weeks)
57             };
58             courses.push(courseInfo);
59         }
60     }
61     //optional: for debug only
62     //console.info(courses);
63     
64     finalResult = {
65         "courseInfos": courses,
66         "sectionTimes": createSectionTimes()
67     };
68     return finalResult;
69 }

    4x00 调试阶段

      由于这段代码已经正常工作了,我在调试的时候也就没有遇到什么困难。

      你只需要在教务系统页面右键选择"运行函数"然后查看console,如果是

 

      那么Chrome就测试通过了。

    4x01 E2E调试

      项目写完之后点击“上传”,左侧便会产生一个带版本号的工作空间,这代表在自己的手机上可以进行E2E测试了

 

     在手机上打开vConsole即可看到相关Console的输出,便于判断错误

    常见错误说明:如果是Unexpected token o... 那么请检查你的数据结构是不是正确传出了。

 

以上

第一次做JS,别打我(逃


 

posted @ 2020-10-06 13:09  二氢茉莉酮酸甲酯  阅读(3444)  评论(1编辑  收藏  举报