【BioCode】根据seq与位点信息截取窗口

代码说明

 

sequence24371.txt

 

以上为所有氨基酸的编号,序列,与位点标记。根据标记为“1”的位点,截取窗口:如下(实验结果):

图示为一个窗口为12的蛋白质片段 2N+1=25;

实现代码:

 

#include<stdio.h>
#include<stdlib.h>
#include<string.h>
#include<algorithm>
#include<iostream>
#define N 12
using namespace std;
void jieduan(int n,char s3[],char s1[],int l)
{
    int i;
    if(n<N)
    {
        for(i=n-N;i<0;i++)
        {
            s3[i+N-n]='*';
        }
        for(i=0;i<=n+N;i++)
        {
            s3[i+N-n]=s1[i];
        }
        s3[i+N-n]='\n';
    }
    else if(n>=l-N)
    {
        for(i=n-N;i<l;i++)
        {
            s3[i+N-n]=s1[i];
        }
        for(i=l;i<=n+N;i++)
        {
            s3[i+N-n]='*';
        }
        s3[i+N-n]='\n';
    }
    else
    {
        for(i=n-N;i<=n+N;i++)
        {
            s3[i+N-n]=s1[i];
        }
        s3[i+N-n]='\n';
    }
}
int main()
{
    int i,j,k,l,m,n;
    char s[10000],s1[10000],s2[10000],s3[100];
    FILE *p1=fopen("sequence24371.txt","r");
    if(p1==NULL) printf("File not open!\n");
    FILE *p2=fopen("positive12.txt","w");
    FILE *p3=fopen("negative12.txt","w");
    while(fgets(s,50000,p1))
    {
        fgets(s1,50000,p1);
        fgets(s2,50000,p1);
        l=strlen(s2)-1;
        for(i=0;i<l;i++)
        {
            if(s1[i]=='K')
            {
                jieduan(i,s3,s1,l);
                
                if(s2[i]=='0')
                {
                    fputs(s3,p3);
                }
                else
                {
                    fputs(s3,p2);
                }
            }
        }
    }
    //system("pause");
    return 0;
}

 

注:

①更改#define N 12 可以任意改变要截取的窗口大小

positive12.txt为生成的正样本窗口,原本标记为“1”

negative12.txt为生成的正样本窗口,原本标记为“0”

 

posted @ 2017-07-10 15:13  于淼  阅读(231)  评论(0编辑  收藏  举报